サイバー皮質 拡張された知覚と思考のシステム

こんにちは



Cyber​​cortex.orgはオープンソースプロジェクトです。 スタートアップ段階にあり、人間の知能の開発のためのタスクを解決するために企業と開発者の努力を集中し調整する機会と見なされています。 思考を強化し、生産的なコミュニケーションを加速する新しい形態を日常生活に導入する。 したがって、何らかの形でこの問題に興味を持っているすべての人が協力するように招待されています。



以下は、Cyber​​cortexの「コア」であるCyber​​meanアルゴリズムの最初のモジュールの説明です。 以下に説明するロジックがHabraの居住者にとって適切である場合、Cyber​​meanおよびCyber​​cortexモジュール全体の説明と議論を続けることができます。 また、投稿の最後に、最初のモジュールのロジックに加えて、Cyber​​cortexのフレームワーク内のインターフェイスの通信のイメージが、プロジェクトの主題を特徴付ける追加の視覚資料として提供されます。



画像







画像



私たちの仕事は、同義語の最も完全な選択と、比較対象のテキストに含まれる関連語の定義を取得することです。



したがって、テキスト1の同義語と定義を選択します。次に、テキスト2についても同じことを行います(以降、両方のテキストは、それらがいくつあってもよいため、テキストNとして示されます)。



次に、取得したサンプルを比較できます。



これらのサンプル内の単語(ソースワード、同義語、およびキーワード。以下を参照)の一致が多いほど、それらの意味のテキストが近くなります。 何かに対する賛成または反対の声明ではなく、主題に関して、トピックに関して。



サンプリング



同じ言語の同義語辞書で最初にテキストNの関連する各ソースワードの同義語を検索する操作を実行できます(対応する操作を実行して、テキストを正規化します;まず、ステミング;スキーム2では、これは同じ終了L_numberを持つブロックの個別の列です)。 テキストNの各単語に対して定義検索操作を実行することもできます。次に、定義キーワードに対して同義語検索操作を実行します(キーワードは、頻度[たとえば類似のLSA]、辞書で提示される定義の最大数の形態学的および字句解析を使用して識別されます) ;キーワードおよびキーワードの同義語は、スキーム3.1および3.2に示されています。



同時に、関連する各単語を(言語1から言語2(N)に)外国語に翻訳してから、同じ操作を順番に実行するだけでなく、外国語(2(N)言語に)単語に翻訳することもできます。これは、言語1の操作中に表示されます。言語2(N)の操作を単独で補完します。 つまり、キーワード1とその同義語を言語1から外国語(言語2(N))に翻訳し、この操作なしで一部の単語が存在しない場合、これらの単語を考慮してアクティビティを構築します(このロジックを図4に示します) 。



その結果、テキストNの関連する各単語について、サンプルのセットを取得します。各単語のサンプル数は、システムに含まれる言語の数に等しくなります。



-*前置詞および同様の構成は無関係とみなすことができます。 以下「関連語」と呼ぶ「単語」



画像



画像



画像



画像



したがって、テキスト内の単語に出会うと、特定の単語と、垂直リンク(直接の同義語の行、定義キーワード、キーワードの同義語の行)および水平の言語間リンクを介して関連するすべての単語が結果のサンプルに分類されます。



したがって、サンプルには、テキストが作成されている言語の国の辞書だけでなく、世界中の辞書(システムに統合されている辞書)からの関連する関連語が含まれています。



画像



シノニムのリストで単語が異なる言語で見つかった場合、シノニムが1つの言語でのみ見つかった場合よりも元の単語と同義であると想定できます。



上記の操作により、意味は似ていて、辞書には含まれているが間違って配置されている同義語の全範囲を参照できます。 つまり、シノニムを見ると状況は中和されますが、一般的な国語辞書はそうではありません。



画像



画像



ただし、「ボールでジャンプする男」は「ボールで遊ぶ男」と読むことができます。 これは、「ジャンプ」、「戯言」、「遊び」という単語の直接および間接の同義語(キーワードの同義語、キーワードの翻訳された同義語)のサンプルで特定の数の同一の単語を見つけるという事実にアルゴリズムに反映されます。



画像



ただし、この場合、「子供」と「子猫」という言葉は、男性、女性-子供、または男性、女性-子猫よりも間接的な同義語の一致が多いことが決定的です。



さらに、キーワードを見つけるという操作をキーワードの同義語に適用すると(つまり、新しいレベルの反復として)、子供、男性、女性が人間であることがわかります。 子猫は動物です。



つまり、新しいレベルのサンプルでは、​​子供、男性、および女性は、それぞれが子猫のサンプルと一致する回数が多くなります。



これは、ステートメントを意味に従って分離するための次の基準になりますが、この追加レベルの反復で明らかになったため、影響は小さくなります。



おわりに



この簡単な例は、テキストの意味的近接性を判断できるテキスト分析の原理を示しています。 テキスト内の文字(単語)が多いほど、意味が似ているテキストを区別しやすくなります。 よりユニークなのは、関連する単語の選択です。



この原則は、Cyber​​meanアルゴリズムの最初のモジュールです。 この原則に基づいて、2番目と3番目のCyber​​meanモジュールが機能します。



***



インターフェース素材からの画像:



画像



ウェブサイト: www.cybercortex.org



All Articles