このテキストをこのように解釈した理由を説明する必要があります。 判明したように、プーシキンの作品の専門家のコメントによると-それは間違っていますが、この例を歴史的な正確さの観点ではなく、自然言語のテキストを機械で解釈する方法の観点で検討します。
シンタックス従属のツリーとは何かの定義から始めましょう(共通空間-従属ツリー)。 これは、ノードが文の単語である順序付けられたグラフ(つまり、ツリー)であり、その階層および従属システムは、どの単語が文の主語であり、どれがどれに依存するかを決定します。
明確にするために、私が意味することのいくつかのショットを与えます:
プレゼンテーション番号1のバリアント:

プレゼンテーションオプション番号2:

2番目のバージョンでは他のすべての例を挙げますが(最初のほうが便利だと思いますが)、ほとんどの資料は2番目のバージョンにあるため、要求しないでください。
このようなスキームの主な単語は常に述語です。したがって、各文は何かのプロセス(誕生、贈り物、到着など)として考えられ、そこからすべての追加情報が抽出されます。 トリプレットからのオントロジーが真ん中(主題とオブジェクトの束)をつかみ始めるように。
このようなスキームでの文の解釈と解釈の正確さを評価するための主な基準は、従属ツリーの射影特性です。 簡単に言えば、下位ツリーは、分岐が交差しない場合に射影的です。
射影的に:

射影的ではない:

これはもちろん単純化されたモデルです-射影とみなせるように文の構造にさまざまな制限を定義する射影の程度(厳密に射影および弱射影のツリー)が数学的に記述されています。
射影木モデルは、フィクションや詩にはほとんど役に立ちません。著者は、自分の感情を表現したり、文に表現を追加しようとすると、構文の多くの規則と受け入れられた語順に違反します。


通常のテキストでは、射影性の欠如は、コンパイラのリテラシーの欠如の兆候です。

射影木はフィクションではかなりまれです。
さて、今、その同じ論争の例:

(標準的な意味を持つ)上位の従属ツリーは射影的であることに注意してください。
従属ツリーのモデルは世界と同じくらい古い(少なくとも60年)-コメントの束、予約の束があり、すべてのケースに適用できるモデルではありません-より近代的な(より複雑なモデル):コンポーネントのシステムなどがあります。 しかし、このモデルのおかげで、プロポーザル自体のかなり多くの特性を取得できます。
現代の多くのセマンティック分析アルゴリズムでは、このモデルは純粋な形では使用されません(また、射影ルールは多くの人によって拒否され、他のものに置き換えられます)が、基本的な考え方はまだ生きています。