セマンティックノミを処理するこのようなツールはどこで入手できますか?

出版物「純粋な魂で汚れたプログラミング」に触発されたhttp://habrahabr.ru/company/abbyy/blog/144859/



ABBYYのDmitryの投稿で、多くの意味を持つ優れたメタファーが提供されました。 才能の欠如と執筆の才能に腹を立てない著者は、物理的な法則から数学的な確率論への目に見えない「量子変換」が行われる、「ソフトウェアハードウェア」から情報フィールドへの「コンピューターハードウェア」から実質的な精神的移行の非常に薄い境界球体に触れています。



確かに、汚れたものをきれいにするためには、常にきれいなものを汚す必要があります。 そして、マーフィー・コレクションのこの原則は、実質的な世界には絶対に当てはまりますが、精神領域にはまったく適用されないことがわかります。



「ダーティプログラミング」を「ダーティマテリアル」のクリーニングとリサイクルの「ダーティテクノロジー」と言えば、テクノロジー自体が「クリーン」でも「ダーティ」でもないことを知っておく必要があります。たとえば、化学は「社会主義者」または「資本家」であってはなりません。 しかし、すべてのテクノロジーは「正確」または「ラフ」として特徴付けられています。 同時に、正確性や無礼さは2つのコンポーネントのいずれかによって影響を受けますが、実際にはそのツールである任意のテクノロジーが構成されています。 通常のシャベルがこの能力で機能する場合、このガーデニングツールを時計のメカニズムを修復するドライバーとして使用できないことは明らかです。ただし、技術の2番目のコンポーネントである方法論はどちらの場合も同じです。つまり、ツールで回転させるだけです。 単純な電動ドライバーでも、精密なネジには粗すぎます。 したがって、テクノトロニクスの最初の原則は、技術的手段が「汚れ」の規模に匹敵しなければならないということです。そうでなければ、除去されません。



したがって、「汚れた」情報原料を「クリーンな」情報製品にうまく処理するには、上記の条件を厳密に満たす必要があります-技術的な処理ツールは、より薄く、小さく、より正確でなければなりません...つまり、「汚れ要素」自体よりも正確に、詰まる、汚れる、汚れた情報原材料が洗浄される。 この場合にのみ、「カツレツとハエ」を分離することができます。つまり、メインとセカンダリ、有用なものと不要なものなどを分離することができます。



逆に、何らかの方法で何かを洗浄できず、特定の純度レベルまで処理できない場合、これは厳密に1つのことを意味し、ツールは明らかにレビューの条件を満たしていません。つまり、それは愚かな粗雑な手段です。



今日、プログラマーにとっての非常に野心的なタスクの1つが危機にatしており、そのさまざまなバリエーションは、言語学者とのサイバネティックス、または言語学者との脳の専門家によって、すなわちコンピューターによって人間の意識の活動の情報製品を認識するという形で具体化されていません作成された視聴覚画像または単にグラフィック画像のセマンティックおよび/またはセマンティックの読み込みを理解する必要がある場合の、言語のエピスタリックまたは言葉による表現(テキストまたは音声) 人々によって飛行。

これらのバリエーションの1つは、個々の言語の書記記号のセマンティクスを区別するレベル、および文脈の意味を抽出するレベルの両方で、自然言語テキストを機械で理解することです。これは、私の意見では、そのような権威のあるドミトリーの人の栄光ある労働者によって行われますABBYYのような非常に尊敬される会社。



そして、どこで、どこで、ここであなたが必要とするすべてが必要かつ十分な量で利用できるように思われます-従業員の知的能力(異常に高い)、適切な資金調達(まともな)、必要な方法論(最も幅広い品揃え)、そして必要なツール(Comprenoから、あらゆる種類のガジェットを備えたニューロセマンティックネットワークまで、すべて揃っています)。 そして、望ましい結果はありません!? なんで? はい、正確に言えば、ツールは正確ではないからです! そして、この分野では単に不適切です。 シベリアのフェルトブーツとそれらの重大度を比較しませんが、「実質的な」問題の解決に役立つ可能性のある使用された手段は、それらが情報分野で果たす役割にまったく対応していません。

具体的には、言語を使用することは、手続き的思考の分野で操作することは不可能であることを意味します。つまり、「粗言語メス」を使用して脳ニューロンの超微細意味ゾーンで操作することはできません。 このためのツールは、適切で、十分に薄く、正確で、鋭敏でなければなりません。 たとえば、電気工学では、バリオメータ(ポテンショメータ)のチューニング範囲がエラーのサイズ(つまり、検討している場合の「ノイズ」または「汚れ」)よりも大きくならないという原則があります。



言語学は、ご存知のように、文中の単語(スピーチまたはテキスト)間のつながりや関係を確立できますが、完全ではありません。 建設科学分野が、さまざまな建築構造(コンテキスト)内の建築要素(単語)間の接続と関係を確立する方法に似ています。 両方の地域の専門家は、これらの接続と関係(関係)をいくつかの形式化された表現の形で提供できます。たとえば、「モース硬度が6の1000ピースのレンガ3トンは、100キログラムのポルトランドセメント500と200キログラムの石英砂で結ばれています」。



そのようなレコードがどのようなデザインであるかを推測することはほとんどありません。 同様に、コンピューターには、そのようなレコードが何であるかがわかりません。[件名 "カートリッジ"は、 "入力"という述語に関連付けられ、 "ストアへ"という文グループの前置詞 "in"に関連する述語を形成します。 しかし、ビルダーが「レンガの壁」というフレーズを言った場合、実際に何を話しているのかすぐにわかり、脳を動かさず、トンをキログラムに、砂をセメントとレンガに縛り付けません。



さらに、言語学者が「カートリッジが店に入った」というフレーズを言うと、話している[カートリッジ](チーフ、電気製品、旋盤の一部、または射撃対象)を正確に理解することは事実とはほど遠い。 ただし、[ストア]の下では、少なくとも自動機械のホーン、少なくとも商社のさまざまなイメージを理解できます。



これらの例は、コンピューターはコンピューター言語学を使用して音声コンテキストのセマンティックロードを理解できないため、完全に異なるツールが必要であるという明確なアイデアを提供するはずです。 どっち? そしてまさに私たちが日常生活で使用するもの。



人々の間の思考とコミュニケーションがどのように行われるかを見てみましょう。 まず、個人の意識の中で、特定の思考形式が群がっています。彼はそれを画像の行動モデル(MPO)の形式で想像します。 その後、彼はこれらのMPOから1つまたは別のセマンティックコンストラクトを構築し、残念ながら、または幸いなことにテレパシーがないため、自然言語機能を使用してそれを伝えることにします。 thoughtformsの作成者は、メッセージでMPOを言語要素(単語、トークンなど)を使用してエンコードされた形式で提示します。 メッセージを受け取った受信者は、連想記憶をすでに含んでおり、そこから一時的に保存された自分のIGOを取り出し、その助けを借りて著者が何を言いたかったかを理解しようとします。



これが私たちの意識の仕組みです。 コンピューターはどのように機能しますか? 彼はどのテクノロジーを使用しますか?また、それらは人間のものと似ていますか? いいえ、彼らは私たちのものではありません。 しかし、コンピューターは計算機であるため、開発者はMPOを単に保存して操作することで意味を理解するようコンピューターに教えるのではなく、頑固に最終結果を計算しようとします。



画像と意味を正確に理解し認識する正確な手段が必要な場合、「コンピューティング」テクノロジーはまさにそのような「汚れたシンデレラ」の役割を果たします。



All Articles