改革前の辞書:レシピ

おそらく多くのhabra-userが知っているように、今日、5月24日、彼らはスラブの執筆の日を祝います-NUTという言葉が「運営費」を意味しない人々の休日 今日は、現代のロシア語の形態学的辞書から、改革前のスペルでロシア語の辞書を作成する方法を説明します。 まず最初に。







私たちの多くが知っているように、ロシアの1917年の革命は負債の義務だけでなく、ロシアのアルファベットからのいくつかの手紙もキャンセルしました。 しかし、改革前のルールは忘れられず、改革前に発行されたテキストもかなり保存されています(私の控えめなホームライブラリにも数冊あります)。実際、そのビンテージグラマーの形態辞書を作成するというトピック自体は興味深いものです。 改革は、一部の文字(i、ѣ、ѵ、およびѳ)が流通から削除され、また、これらの文字の使用に直接関係しないいくつかの規則が変更されたという事実から成りました。 ウィキペディアの詳細。



今日は、通常の現代ロシア語の形態学的辞書から、改革前言語の形態学的辞書を生成する方法について説明します。





形態学的辞書または形態をサポートする辞書とは何ですか? この用語は、単に各単語の可能なすべての単語形式を含む辞書ではなく、各単語に対してこれらの単語形式を生成する方法を知っている辞書と呼びます。 もちろん、これはスペースを節約するだけでなく、「 seeker 」という単語を「 seeker 」という単語(genus。Cf. genus)とともに追加することを忘れていないという希望も与えます。 単語の文法カテゴリは、単語の単語形式を生成する方法を担当し、各単語は特定の文法カテゴリを参照します。

さらに、 gray-brown-raspberryなどの単語からの組み合わせの爆発がないように、いわゆる複合ルールが辞書に追加されます。 それらは、そのような構造を生成するために必要です。 各複合ルールは、いくつかの法律に従って単語を生成します。 コンポジットは、明示的な分割ポイント(上記の例ではハイフンの両方)を持ち、コンポジットの一部が単純に互いにドッキングするときに暗黙的にすることができます。 たとえば、複合ルールの特殊なケースは、接頭辞「 re 」を持つ動詞を形成する方法です。rewriteremakemoverewrite ...ロシア語では、明らかな分割点のない複合は不要に思えるかもしれませんが、ドイツ語を知っている人はおそらく同意するでしょうそれらが必要であること。



そのため、形態のロシア語辞書からロシア語の改革前の辞書を作成しています。 違いを見て、それらを新しい辞書に徐々に紹介します。 したがって、まず最初に、最も単純な点を考慮してください。



子音で終わる単語の最後で改革は廃止されました(Yを除く)。 彼を元の場所に戻すのに問題はありません



文字ѵとTheは、改革時の最後の日でした;それらを含む単語のリストは非常に小さいです。 簡単に回復できます。



文字іは 、単語mіr (宇宙が存在するものであり、戦争の反意語ではない)、および母音との前の通常の単語で使用されましたが、複合規則(化学的Iですが、これ言語)によって形成されたものを除きます。 基本および文法カテゴリの辞書でこれを修正することは難しくありません。正規表現の形式で置換を使用して検索することは簡単な操作です。



-、 cart-once-roses-bottomcasestory )の接頭辞の末尾にs / zが付いたルールも単純になり、-、through-、 throughuselessinterlacedなしで接頭辞の変更をキャンセルします。



現在のロシア語辞書でまだ複合ルールが不要な場合は、これらの変更と保存が最初のパートの最後の複合で提供される必要があることに注意してください。



次に、エンディングを操作しましょう。 -yの-thの終わりに加えて複数形の形容詞は、男性の対格の単数形では、-thと-thを-agoと-yagoに置き換えます。 これは難しくありません。また、名詞の語尾にあまり洗練されていない変更を追加します。 単語her 、he、 oneoneoneoneone を追加します(このテーマの文法的なカテゴリをいじくりたくない場合は、少なくとも変更しないでください)。



そして、これらの簡単な操作の後、私たちは最も興味深いことになりました。 recoverを回復するには?

トピックは単純ではありません。ウィキペディアにはこのテーマに関する別の記事があります。 最初に、単純な部分を理解しましょう。 文法的カテゴリーは、道具的、与格的、前置詞的、形容詞と動詞の比較的で優れた形態を担当しています。 2桁の数字-再帰代名詞と同様に、手動で変更します。 副詞と前置詞はいくらか大きくなりますが、それらの置き換えも非常に高揚する仕事です。 しかし、大量の語彙をどうするか?

ここで私たちは救助に来ます...ウクライナ! 突然ね



事は...ああ、申し訳ありませんが、夢中になったということでした。 ウクライナ語とロシア語は非常に似ています(まあ、本当に?)。特に、多くの単語は似ています。 ルールはこれです-ロシア語でѣが使用された多くの場合、ウクライナ語では、この場所に文字iと非常によく似た単語があります。 カブという言葉の2番目の文字が何であったか分からないのですか? ウクライナ語のrapturnipの辞書を確認してください。 同様に、単語repairと言う。 もちろん、単語の意味が変わることもあります(たとえば、ウクライナ語の意味は何ですか?)。しかし、私たちの目的にとって、これはあまり重要ではありません。 ウクライナ語に類似語がない場合、たとえば「父」という言葉のように、私たちにとっては悪いことです。 手動での作業を完全になくすことはできません。ボリュームを大幅に削減できることを嬉しく思います。 このような単純な知識とウクライナ語の形態学的辞書を使用すると、マークアップの自動化が容易になります。

小さな余談:言語学
この現象の理由は、共通の原言語をロシア語とウクライナ語に分割する前に、ѣとeが異なって発音されていたが、ロシア語とウクライナ語がさらに分岐し、ロシア語inがeと同じように、ウクライナ語で発音され始めたことにあるようです私のように。

ところで、もう1つの検証ルールがあります-ストレス下のルートで文字letterが使用される場合、ストレスなしで文字eが使用されますが、ここでは、 村-村のいくつかの例外がありました。




そして、ウクライナ語辞書が手元になかったら? Duzhe Skoda :)私たちは自分自身の正確さに頼り、少なくともleastの根がまだ9000未満であることを喜んでいる必要があります。



すべての操作の後、辞書でそれらをサポートする予定がある場合は、最新の転送ルールよりも厳しい事前改革に対処する必要があります。

その結果、改革前の地形を使用してロシア語の形態学的辞書を取得します。

ご清聴ありがとうございました

words'yanskoi文字のZ日!



UPD: paulousky (およびブログエディター)のリクエストにより、 サンプルが追加されました。



All Articles