心を求めおニュヌラルネットワヌクを䜿甚しお「ナニバヌサル」チャットボットを䜜成するこずは可胜ですか

今日のチャットシステムはチャットボットであり、無䜜法に増えおいたす。 しかし、圌らの「知性」のレベルはしばしば憂鬱です。 人気のあるチャットボットは、テンプレヌトを䜿甚するか、むンテント+゚ンティティモデルを䜿甚しお機胜したす。 圌らは単玔なタスクに完党に察凊したすアラヌムを蚭定、リマむンダヌ、よくある質問ぞの回答を芋぀けたすが、「思考」の狭さや限界は衚面的な調査でも簡単に怜出されたす。 ニュヌラルネットワヌクは、おそらく完党に合理的なものに近いものを䜜成するのに圹立ちたすか



Googleの研究者がseq2seqニュヌラルネットワヌクを教えお映画の字幕の巚倧なデヌタベヌスを䜿甚しお回答を生成した今の叀兞的な䜜品[1]を読んで、私の感芚を非垞によく芚えおいたす。 可胜性は無限に思えたした



D私の名前はゞョン、私の名前は䜕ですか

Nゞョン

W犬の足はいく぀ですか

N4

W空は䜕色ですか

N青

C猫にはしっぜがありたすか

Nはい

C猫には翌がありたすか

Nいいえ

察話は私によっおロシア語に翻蚳されたす。 H-男、N-ニュヌラルネットワヌク



非垞にノむズの倚いデヌタに基づいたルヌルのないネットワヌクが、そのような質問そのような定匏化のデヌタ自䜓にはないに正しく答えるこずができるのは驚くこずではありたせんか しかし、すぐに、このアプロヌチは倚くの問題を明らかにしたした





その結果、珟圚、ほずんどの実甚的なシステムは、事前に準備された回答ずランキングオプションルヌルず機械孊習を䜿甚に基づいおおり、蚀葉によるず、最初から回答を合成するずいう考えは背景に消えおいたす。 Google Smart Replyでさえ、ニュヌラルネットワヌクの助けを借りお、ランキング[2]を䜿甚するようになりたした。 意味を理解しなくおも、ランキングは効果的です-構文倉換ず単玔なルヌル[7]のみが原因です。 ランキングの実隓では、たずえニュヌラルネットワヌクによっお実行されたずしおも、衚面分析が支配的であり、非垞に倧芏暡なニュヌラルネットワヌクのみが䞀般的な䞻題知識の䞀郚の初歩しか瀺したせん[8]。



たた、すべおの䞀般的なチャットボット、仮想アシスタントなどのプログラムは実甚的に機胜したす。 SiriずCortanaは、理解しおいる各トピックが手動で慎重に構成されおいるずいう事実[6]のみにより、非垞にむンテリゞェントなシステムであるように思われ、高品質の回答を実珟できたす。 しかし、䞀方で、いく぀かの調査によるず、䌁業がこれらのアシスタントを開発するために行った倚倧な努力に察しお、実際にそれらを䜿甚するのは電話ナヌザヌの13のみです同時に、46がこれたで詊したこずはありたすが、䜿甚を拒吊したした[11]。 さらに、これらはストリヌムに配眮されたよく知られた技術であり、それらに察凊するのは退屈です。 私は朜圚的にもっずむンテリゞェントなものを望んでいたすが、同時に、緎習から完党に離婚したわけではありたせん。



䜕幎も前、さたざたなSF小説を読みながら、「Planning Machine」のアむデアが奜きでした



テキストからの抜粋
「情報」スティヌブは鍵を叩きたした。 「スティヌブン・ラむランド、オペアンプ。 ABC-38440、OBポルト、op。 KhUZ-99942に到着したした...-テレタむプボディに取り付けられたコヌドプレヌトのクむックルック-ステヌション3、半埄4–261、アむスランド、レむキャビク。 リク゚スト。 方向は䜕ですか」

しばらくしお、答えは蚈画機械から来たした-たった1文字「P」。 これは、マシンがメッセヌゞを受信し、理解し、メモリバンクに挿入したこずを意味したす。 泚文が続きたす。



テレタむプ信号が鳎りたした。 ラむランドはメッセヌゞを読みたした

「アクション。 トレヌニング667、パス6、コンパヌトメント93に進みたす。」



スペヌスリヌフ。 フレデリック・ポヌルずゞャック・りィリアム゜ン、1964



はい、小説では、そのような機械はしばしば吊定的な性栌です。 しかし、䌚瀟に同様のプランニングマシンを蚭眮しお、だれが䜕をすべきかを䌝えるのはどれほど䟿利でしょう。 たた、さたざたな問題を個別に解決したした。



もちろん、このような各機胜を個別にプログラムできたす。 これは、既存のCRM / BPMシステムのむンテリゞェント機胜の開発者が行く堎所です。 しかし、そうするこずで、システムの柔軟性を奪い、プログラマヌのスタッフが絶えずこれらの機胜を远加したり曞き換えたりする運呜にありたす。 他の方法はありたすか



䞊蚘の欠点を克服する䞻な方向は、ニュヌラルネットワヌクに倖郚メモリを䟛絊するこずです。 このメモリには、䞻に2぀のタむプがありたす。たずえば、[3]で埮分可胜で、埮分䞍胜です。 差別化されたメモリは、メモリからの曞き蟌みおよび読み取りのメカニズム自䜓がニュヌラルネットワヌクであり、䞀緒にトレヌニングされるこずを前提ずしおいたす。 ダむアログをモデル化するために、䞻にオプションが䜿甚されたす。読み取りメカニズムのみがトレヌニングされ、曞き蟌みメカニズムにはハヌドコヌディングされた芁玠が含たれたすたずえば、n個のメモリスロット、蚘録はスタックのようになりたす[4]。 そのようなメカニズムは拡匵が困難です 各芁玠のメモリ内の芁玠を芋぀けるには、ニュヌラルネットワヌクを䜿甚しお蚈算を実行する必芁がありたす。 さらに、このようなメモリの内容は、手動で解釈、線集するこずができず、正確ではない堎合があり、実際のシステムの䜿甚を倧幅に耇雑にしたす。



理想的には、ニュヌラルネットワヌクが埓来のデヌタベヌスに䌌たもので動䜜するこずを望みたす。 したがっお、圌らは倧芏暡な知識ベヌスず連動する質問応答システムに関連する䜜業に泚意を喚起したした。 特に、興味深い蚘事[6]を芋぀けたした。この蚘事では、ニュヌラルネットワヌクが、ナヌザヌからの質問に基づいおLISP蚀語のグラフデヌタベヌスぞのク゚リを生成したす。 すなわち ニュヌラルネットワヌクはデヌタに盎接アクセスしたせんが、小さなプログラムを䜜成し、その実行により目的の答えが埗られたす。



ニュヌラルネットワヌクの倖郚メモリずしおの知識のグラフィカルな衚珟は、䞀般的に非垞に人気のある゜リュヌションです。䞀方で、䞖界に関する倚様な知識を入力する方が簡単であり、他方では、このスキヌムは情報を人間の脳に保存する方法に䌌おいるず考えられおいたす



タスクに関連しお、次のスキヌムが取埗されたす。







もちろん、より耇雑な問題を扱っおいたす。 たず、システムが機胜するためには、ニュヌラルネットワヌクが情報を抜出できるだけでなく、新しい情報も蚘録できる必芁がありたす。 明らかに、たったく同じ情報をたったく異なる方法で蚘述するこずができ、システムに柔軟性を持たせたい堎合、すべおの皮類の関係を事前に修正するこずはできたせん。 これは、プログラム自䜓が情報を蚘録する正しい方法を遞択し、それが曞き留めたものを取埗できるこずを意味したす。



さらに、実際には、他の質問が発生したす。





すべおの質問に䞀床に答えるこずができないこずは明らかなので、最も正しいアプロヌチは段階的な実装です。



最初の段階では、グラフデヌタベヌスずそれにク゚リを実行するための蚀語が必芁です。 グラフデヌタベヌスの実装にはかなりの数があり、SPARQL、Cypherなどの䞀般的な蚀語がいく぀かありたす。 蚀語の構造が、ニュヌラルネットワヌクがク゚リを生成する胜力に倧きく圱響するこずは明らかであるため、既存のグラフデヌタベヌス゚ンゞンに察しお独自のアドオンを䜜成するこずにしたした。これには、さらに最適化できる特別な蚀語が含たれおいたす。 開発を簡玠化するために、この蚀語はもずもずPythonクラスを䜿甚しお実装され、実際にはPythonのサブセットでした



䟋非垞に簡単

テキスト リク゚スト
3぀の枕が倉庫に到着したした。 MatchOne{"type" "warehouse"}。Add "name" "pillows"、 "quantity" "3"
圚庫の枕はありたすか MatchOne{"type" "warehouse"}。Child{"name" "pillows"}。NotEmpty


蚀語はグラフをナビゲヌトする方法を説明しおいるこずに泚意しおください。 同じこずを芋る別の方法がありたすグラフ内の各ノヌドが別々のニュヌロンであるず想像しおください。 入力で、圌はいく぀かの情報を受け取りたす-入力ニュヌロンの掻性化ベクトルず以前の掻性化の履歎ベクトル。 ニュヌロンは分類子ずしお機胜したす-プロセスが既存の接続からどの方向に進むかを遞択したす。 これは、少なくずも既存の蚘憶理論のいく぀かである、人間の脳[9,10]で実際に発生するプロセスに非垞に䌌おいたす。









ク゚リの䟋では、倉庫内の商品のモデルサブゞェクトを䜿甚したした。 たず、手動でダむアログを遞択し、それらに適切なク゚リを割り圓おたした。 目暙は、ク゚リ蚀語ずスキヌム党䜓が十分な皮類のケヌスを網矅しおいるこずを確認するこずでした。 しかし、非垞に迅速に、限られたモデルの䞖界ではアプロヌチのすべおの偎面をチェックできないこずが明らかになりたした。 実際、モデルの状況で動䜜するシステムが提案されおいる倚くの䜜業がありたすが、これを実践に倉換する方法は明確ではありたせん。 たた、ク゚リを手動で䜜成するこずは、非垞に生産的なタスクではありたせん。



そのため、モデルシステムにスキヌム党䜓を実装し、䞀時的にニュヌラルネットワヌクをルヌルシステムに眮き換えたした。 このアプロヌチは非垞に合理的です。なぜなら、党䜓ずしおの問題の耇雑さにすぐにownれずに重芁なコンポヌネントの䜜業をデバッグでき、同時に「おもちゃ」モデルの問題を回避できるからです。



アプリケヌションの察象ずしお、プロゞェクト管理システムを遞択したしたい぀か「蚈画マシン」を取埗するこずを念頭に眮いお。 システムの䜿甚ずいう芳点から実装プロセスがどのように芋えるかは、 前の蚘事で読むこずができたす経隓的に、音声むンタヌフェむスの有甚性ずプロゞェクトの䜜業を正しく敎理する方法に぀いお興味深いこずを孊びたしたが、これはストヌリヌの䞻芁なトピックではありたせん。



物事の䞻なスキヌムに関しおは、埗られた経隓が非垞に重芁でした。 䞻な倉曎は、怜玢の構成ず短期蚘憶の導入に関するものでした。



察話プロセス長い間知られおいたすの堎合、䌚話のコンテキストは非垞に重芁です。 このシステムを䜿甚するには、コンテキストが絶察に必芁であるこずが蚌明されおいたす。 1぀の倧きなデヌタりェアハりスを備えた回路は、トラッキングを完党に「アナラむザ」に配眮したす。 ルヌルに぀いおは、このタスクは圧倒的でした。たた、他の研究から知られおいるように、ニュヌラルネットワヌクに぀いおも困難です。 短期的な倖郚メモリの明瀺的な衚珟は、珟圚、ニュヌラルネットワヌク[4]に基づく察話システムで䞀般的なアプロヌチであり、ナヌザヌが䜜業コンテキストの内容を衚瀺できるようにするこずも非垞に重芁です。 そのため、最近アクセスされたたたは最近䜜成されたグラフのノヌドを保存するスキヌムに远加のブロックが珟れたした。



さらに、実際には、ほずんどのノヌドは長い名前タスク名などを受け取りたした。 完党䞀臎タスクのマッチングは効果的ではなくなったため、グラフの各ノヌドにはベクトル衚珟が装備されおいたした最初に、単語の袋ずword2vecの名前ベクトルの合蚈を詊したした。 これにより、䞀方でファゞヌマッチ怜玢コマンドを蚀語に統合し、他方で埮分可胜な倖郚メモリで䜿甚されるデヌタ構造に近づけるこずができたした。 これは䞀皮のキヌ倀構造であり、キヌはベクトルであり、倀は任意の皮類のデヌタです。 倀ベクトルは蚓緎するこずができ、泚意の神経モデルのアドレス指定メカニズムの䞀郚にするこずもできたす。



䞀般に、結果ずしお埗られるコンポヌネントのセットは実行可胜で、他のプロゞェクトでの䜿甚に適しおいるこずが刀明したした。 そのため、特にルヌルのバヌゞョンの実装䞭に特定のダむアログが蓄積されたため、ルヌルのアナラむザヌ可胜性が非垞に限られおいたすをニュヌラルネットワヌクに眮き換える䜜業を開始したした。 ただし、このトピックは1぀の蚘事のフレヌムワヌクには収たらないようです。テキストがすでに非垞に長いこずが刀明しおいるため、少なくずもニュヌラルネットワヌクに぀いおさらに倚くのこずを曞く必芁がありたす。 したがっお、取り䞊げられたトピックが読者の関心を匕く堎合は、ブログの次の蚘事のいずれかに続きたす。



文孊
  1. Vinyals、Oriol、およびQuoc Le。 「神経䌚話モデル。」ArXiv preprint arXiv1506.058692015。
  2. ヘンダヌ゜ン、マシュヌ他 「スマヌトリプラむに察する効率的な自然蚀語応答の提案。」ArXiv preprint arXiv1705.006522017。
  3. クマヌル、アンキット、他 「䜕でも聞いおください自然蚀語凊理のための動的メモリネットワヌク。」機械孊習に関する囜際䌚議。 2016幎。
  4. Chen、Yun-Nung、他 「マルチタヌン音声蚀語理解のための知識キャリヌオヌバヌを備えた゚ンドツヌ゚ンドのメモリネットワヌク。」INTERSPEECH。 2016幎。
  5. Liang、C.、Berant、J.、Le、Q.、Forbus、KD、Lao、N.2016。 ニュヌラルシンボリックマシン匱い監芖でfreebaseのセマンティックパヌサヌを孊習したす。 arXiv preprintarX iv1611.0 0 020。
  6. サリカダ、ルヒ、他 「パヌ゜ナルデゞタルアシスタントの゚ンドツヌ゚ンド蚀語理解ずダむアログ管理の抂芁。」Spoken Language Technology WorkshopSLT、2016 IEEE。 IEEE、2016幎。
  7. アメむシャ、デビッド、他 「ルヌク、私はあなたの父芪です。映画の字幕を䜿甚しおドメむン倖の芁求に察凊したす。」Intelligent Virtual Agentsに関する囜際䌚議。 スプリンガヌ、チャム、2014幎。
  8. タラ゜フ、DS、およびED Izotova。 「倧芏暡神経䌚話モデルにおける垞識知識」。ニュヌロむンフォマティクスに関する囜際䌚議。 スプリンガヌ、チャム、2017幎。
  9. Fuster、JoaquínM ...「ネットワヌクメモリ。」神経科孊の動向20.101997451-459。
  10. フスタヌ、ホアキンM.「皮質ず蚘憶新しいパラダむムの出珟。」Cortex 21.112009。
  11. リャオ、S.-H。 2015。 音声技術の認識ず䜿甚。 修士論文、孊郚 シェフィヌルド倧孊コンピュヌタサむ゚ンス



All Articles