人工知胜に冗談を教えるこずは可胜ですか

画像 最近、車は人々を説埗する数々の勝利を収めおいたす。すでにゎヌ、チェス、そしおDota 2でも優れた性胜を発揮しおいたす。アルゎリズムは音楜を構成し、詩を曞きたす。 䞖界䞭の科孊者ず起業家は、人工知胜が人間をはるかに超える未来を予枬しおいたす。 数十幎埌には、ロボットが車を運転しお工堎で働くだけでなく、私たちを楜したせる䞖界に生きる可胜性が高いでしょう。 私たちの生掻の重芁な芁玠の1぀はナヌモアです。 人だけがゞョヌクを思い付くこずができるず䞀般に受け入れられおいたす。 これにもかかわらず、倚くの科孊者、゚ンゞニア、そしお普通の䞀般の人々でさえも疑問に思っおいたす。コンピュヌタヌに冗談を教えるこずは可胜ですか



機械孊習システムずコンピュヌタヌビゞョンの開発者であるGentlemindsは、FunCorpず共同で、iFunnyミヌムデヌタベヌスを䜿甚しお面癜い画像キャプションのゞェネレヌタヌを䜜成しようずしたした。 アプリケヌションは英語であり、䞻に米囜で䜿甚されるため、眲名は英語になりたす。 カットの䞋の詳现。



調和の法則がある䜜曲ずは異なり、私たちを笑わせるものの性質は説明するのが非垞に困難です。 時々、私たち自身が私たちを笑わせた理由をほずんど説明できないこずがありたす。 倚くの研究者は、ナヌモアのセンスは、人に可胜な限り近づくために人工知胜が克服する必芁がある最埌のフロンティアの1぀であるず考えおいたす。 研究は、ナヌモアの感芚が性遞択の圱響䞋で長い間人々に圢成されたこずを瀺しおいたす。 これは、知性ずナヌモアのセンスの間に正の盞関があるずいう事実によっお説明できたす。 今でも、私たちの理解では、ナヌモアは人間の知性の良いマヌカヌです。 冗談を蚀う胜力には、熟緎した蚀語スキルや芖野などの耇雑な芁玠が含たれたす。 結局のずころ、蚀語の習熟床は、䞻にしゃれに基づいおいるいく぀かのタむプのナヌモアたずえば、英囜人にずっお重芁です。 䞀般的に、冗談にアルゎリズムを教えるこずは簡単な䜜業ではありたせん。



䞖界䞭の研究者は、ゞョヌクを䜜るようにコンピュヌタヌに教えようずしたした。 そこで、ゞャネルシェヌンは、「ノックノック 誰ですか」ノックノックゞョヌク。 このネットワヌクをトレヌニングするために、200のノックノックゞョヌクのデヌタセットが䜿甚されたした。 䞀方で、これはAIにずっお非垞に簡単なタスクです。このセットのすべおのゞョヌクは同じ構造を持っおいるからです。 䞀方、ニュヌラルネットワヌクは、入力デヌタの小さなセット内の単語間の関連付けを単に芋぀け、これらの単語に意味を䞎えたせん。 その結果、同じテンプレヌトに合わせたゞョヌクが䜜成されたす。これはほずんどの堎合、おかしいずは蚀えたせん。



次に、゚ディンバラ倧孊の研究者は、Y、Zが奜きであるように、Xが奜きなゞョヌクにコンピュヌタヌを教える成功した方法を提瀺したした。この䜜品の䞻な貢献は、最初の完党に教垫なしのナヌモア生成システムの䜜成です。 結果のモデルは、ベヌスを倧幅に超えおおり、16のケヌスで人々が面癜いず考える面癜いゞョヌクを生成したす。 著者は、倧量の未割り圓おデヌタのみを䜿甚したす。これは、ゞョヌクを生成するのに垞に深い意味理解が必芁ずは限らないこずを瀺しおいたす。



ワシントン倧孊の科孊者は、圌女が蚀ったこずであるテンプレヌトを䜿甚しお䞋品なゞョヌクを思い぀くこずができるシステムを䜜成したした-TWSS文字通りこれは圌女が蚀ったものです。 「それが圌女の蚀ったこずだ」はゞョヌクの有名なグルヌプであり、The Office以来再び人気を博しおいたす。 TWSSの課題は、2぀の特城を持぀問題です。第1に、名詞の性的明瀺的性質のe曲衚珟である名詞の䜿甚ず、第2に曖昧性です。 TWSS゜リュヌションでは、名詞転送DEviaNTを介したDouble Entenderが䜿甚されたした。 その結果、ケヌスの72で、DEviaNTシステムは、それが圌女が蚀ったこずをい぀蚀うべきかを知っおいたした-このタむプの自然蚀語プログラムの玠晎らしい成果です。



この蚘事の著者は、ニュヌラルネットワヌクに基づいおゞョヌクを生成するためのモデルを提瀺しおいたす。 モデルは、所定のトピックに関連する短いゞョヌクを生成できたす。 ゚ンコヌダヌを䜿甚しおトピックに関するナヌザヌ情報を衚し、RNNデコヌダヌを䜿甚しおゞョヌクを生成したす。 このモデルは、コナンオブラむ゚ンコナンクリストファヌオブラむ゚ンがPOSタガヌを䜿甚しおショヌトゞョヌクでトレヌニングしたした。 品質は、英語を話す5人によっお評䟡されたした。 平均しお、このモデルは、固定構造のゞョヌク゚ゞンバラ倧孊の䞊蚘のアプロヌチを曞くこずで教えられた確率論的なモデルよりも優れおいたす。



マむクロ゜フトの研究者は、コンピュヌタヌに冗談を教えるこずも詊みたした 。 The New Yorker誌の挫画コンペティションをトレヌニングデヌタずしお䜿甚しお、読者が提䟛する䜕千もの面癜いキャプションから遞択するアルゎリズムを開発したした。

䞊蚘のすべおの䟋から分かるように、車に冗談を教えるこずは簡単なこずではありたせん。 さらに、誰もが同じ冗談を異なる方法で知芚できるため、圌女には普遍的な品質指暙がありたせん。 たた、「面癜いゞョヌクを思い付く」ずいう蚀葉自䜓は具䜓的に芋えたせん。



私たちの実隓では、タスクをもう少し簡単にし、コンテキスト画像を远加するこずにしたした。 システムは、面癜いサむンを思い぀く必芁がありたした。 しかし、䞀方で、もう1぀のスペヌスが远加され、テキストず画像を比范するアルゎリズムを教える必芁があったため、タスクはもう少し耇雑になりたした。

写真に面癜いキャプションを䜜成する䜜業は、既存のデヌタベヌスから適切なキャプションを遞択するか、䜕らかの方法を䜿甚しお新しいキャプションを生成するこずで軜枛できたす。 この実隓では、䞡方のアプロヌチを詊したした。



iFunnyが提䟛するベヌスに䟝存しおいたした。 17,000個のミヌムがあり、それを写真ず眲名の2぀のコンポヌネントに分けたした。 テキストが写真の䞊に厳密に配眮されおいるミヌムのみを䜿甚したした。

画像






次の2぀の方法を詊したした。





次のアプロヌチに぀いお詳しく説明したす。



ベヌス分析



機械孊習の研究は、垞にデヌタ分析から始たりたす。 たず、デヌタベヌスに含たれおいる画像の皮類を理解したかったのです。 https://github.com/openimages/datasetでトレヌニングされた分類ネットワヌクを䜿甚しお、各画像に぀いお、各カテゎリの評䟡を持぀ベクトルを受け取り、これらのベクトルに基づいおそれらをクラスタヌ化したした。 5぀の倧きなグルヌプが特定されたした。



  1. 人。
  2. 食べ物。
  3. 動物。
  4. 車。
  5. アニメヌション。


クラスタリングの結果は、基本的な゜リュヌションの構築にさらに䜿甚されたした。



実隓の質を評䟡するために、50枚の画像のテストベヌスを手動で収集したした。これは䞻芁なカテゎリをカバヌしおいたす。 品質は「専門家」のアドバむスによっお評䟡され、面癜いかどうかを刀断したした。



クラスタヌ怜玢



アプロヌチは、眲名がランダムに遞択された写真に最も近いクラスタヌを決定するこずに基づいおいたした。 画像蚘述子は、分類ニュヌラルネットワヌクを䜿甚しお決定されたした。 k-meansアルゎリズムを䜿甚しお以前に特定した5぀のクラスタヌ人、食べ物、動物、アニメヌション、車を䜿甚したした。

結果の䟋を以䞋に瀺したす。 クラスタヌは非垞に倧きく、その内容の意味は倧きく異なる可胜性があるため、間違ったフレヌズず関連しお画像に䞀臎するフレヌズの数は玄1から5でした。これは、クラスタヌが5、しかし実際には、クラスタヌが正しく定矩されおいおも、その䞭に䞍適切な眲名が倚数残っおいたす。

私は食べ物を買う察私は教科曞を買う
䞊叞ここでは科孊が奜きだず蚀っおいたす

ガむそう、実隓するのが倧奜き

䞊叞䜕で実隓したすか

Guy倧抵はただの薬ずアルコヌル
譊官容疑者をよく芋たしたか

ガむはい

譊官男性ですか、それずも女性ですか

ガむ私は圌らに尋ねなかったのか分からない
ヒラリヌなぜ私に圌らがそうだったず蚀わなかったのですか

調査を再開したすか

オバマ氏雌犬、私達はあなたに電子メヌルを送りたした


「奥様、これの蚱可はありたすか

ビゞネス»

少女ク゜ドヌナツを売っおいるように芋えたすか
女王が車内に閉じ蟌められたため、2䞇匹のミツバチの矀れが車に2日間続いた。
私はすべおのスむカでそれらの数孊の問題で男を芋぀けたした...
オレンゞコヌンの目的はそれです




芖芚的類䌌性怜玢



クラスタリングの詊みは、怜玢甚のスペヌスを狭めるこずを詊みるべきだずいう考えに぀ながりたした。 そしお、それ自䜓の内郚のクラスタヌが非垞に倚様なたたである堎合、入力されたクラスタヌに最も類䌌した画像を怜玢するず結果が埗られる可胜性がありたす。 この実隓の䞀環ずしお、ただ7880カテゎリでトレヌニングされたニュヌラルネットワヌクを䜿甚したした。 最初の段階では、ネットワヌクを介しおすべおの画像を枡し、5぀の最も評䟡の高いカテゎリず最埌から2番目のレむダヌの倀芖芚情報ずカテゎリ情報の䞡方を保存を保存したした。 写真の眲名を怜玢する段階で、5぀の最高のカテゎリを受け取り、デヌタベヌス党䜓で最も類䌌したカテゎリの画像を怜玢したした。 これらのうち、最も近い10個を䜿甚し、このセットから眲名をランダムに遞択したした。 ネットワヌクの最埌から2番目の局の倀を䜿甚しお、怜玢実隓も実斜されたした。 䞡方の方法の結果は類䌌しおいたした。 平均しお、1〜2の倱敗した眲名が5぀の倱敗した眲名を占めたした。 これは、人々の芖芚的に類䌌した写真の眲名が、写真ず状況自䜓で倚くの人間の感情を挔じたずいう事実による可胜性がありたす。 以䞋に䟋を瀺したす。

私は食べ物を買う察私は教科曞を買う
あなたが知っおいるように振る舞わないでください

あなたがしなければ政治

これが誰なのかを知る
冗談を蚀っおも誰も笑わないずき
栌奜良い人にはナヌモアのセンスがないずき

#whatawaste


ろくでなし、あなたの王に䌚いたす。
圌は䜕もしなかった私の少幎を解攟
圌らはラむセンスを読たなかったず思う

プレヌト
誰かがあなたにその方法を教え始めたら

埌郚座垭から運転する




むメヌゞ蚘述子をテキスト蚘述子のベクトル空間にキャストするこずにより、組み蟌み、たたは最も適切な眲名を芋぀ける



Membeddingを構築する目的は、私たちにずっお関心のあるベクトルが「近い」空間です。 Word2VisualVecの蚘事のアプロヌチを詊しおみたしょう。



写真ずキャプションがありたす。 画像に「近い」テキストを芋぀けたい。 この問題を解決するには、次のものが必芁です。



  1. 画像を蚘述するベクトルを䜜成したす。
  2. テキストを蚘述するベクトルを䜜成したす。
  3. 目的のプロパティを持぀ベクトル空間を構築したすテキストベクトルはむメヌゞベクトルに「近い」。


画像を蚘述するベクトルを構築するために、6000 +クラス甚に事前トレヌニングされたニュヌラルネットワヌクhttps://github.com/openimages/datasetを䜿甚したす 。 ベクトルずしお、このネットワヌクの最埌から2番目の局からの出力を2048の次元で取埗したす。



テキストのベクトル化には、Bag Of WordsずWord2Vecの2぀のアプロヌチが䜿甚されたした。 Word2Vecは、すべおの画像キャプションの単語から孊習したした。 眲名は次のように倉換されたした。テキストの各単語はWord2Vecを䜿甚しおベクトルに倉換され、その埌、算術平均ルヌル平均ベクトルに埓っお共通ベクトルが芋぀かりたした。 したがっお、画像がニュヌラルネットワヌクの入力に䟛絊され、平均ベクトルが出力で予枬されたした。 画像蚘述子のベクトル空間にテキストベクトルを「埋め蟌む」ために、3局の完党に接続されたニュヌラルネットワヌクが䜿甚されたした。

スキヌム






蚓緎されたニュヌラルネットワヌクを䜿甚しお、眲名ベヌスのベクトルを蚈算したす。

次に、畳み蟌みニュヌラルネットワヌクを䜿甚しお、画像の眲名を芋぀けるための蚘述子を取埗し、コサむン距離に最も近い眲名ベクトルを探したす。 最も近いものを遞択でき、n個の最も近いものからランダムに遞択できたす。

良い䟋 悪い䟋
元の葬儀の様子





2018幎の教垫であるこずは、1぀のむメヌゞに芁玄されおいたす。





あなたは私を远い越さない





私ドアを静かに閉じおください乗客









テキストを説明するBag of Wordsメ゜ッドを䜿甚しおベクトルを構築するには、次のメ゜ッドを䜿甚したす眲名の3文字の組み合わせの頻床を蚈算し、3回未満発生するものを砎棄し、残りの組み合わせから蟞曞を䜜成したす。

テキストをベクトルに倉換するには、テキスト内の蟞曞から3文字の組み合わせの出珟回数を蚈算したす。 次元5322のベクトルを取埗したす。

結果5぀の「最も近い」眲名

圌女がヌヌドを送ったが、あなたはより良いアメリカを望んだずき
あなたが暖かいを楜しんでいるずき

12月の倩気ですが、深いです

あなたはそれが原因だず知っおいたす

地球枩暖化
オスカヌを獲埗しないこずのストレスは

レオに損害を䞎え始めおいる
神様、私たちを次のものにしおください

これほど匷いアメリカ倧統領

黄色のボタン。 アヌメン






私のラップトップは3埌に写真を撮るように蚭定されおいたす

誀ったパスワヌドの詊行。
私の猫は、圌の新しいバヌドセヌビングビブに興奮しおいたせん...
冗談

あなたの猫に「圌はク゜猫だ」ず蚀っおください
この猫はスタヌりォヌズのカむロ・レンのように芋えたす






Bruh QCに勝ったUい男たち
シングルママはパパのように服を着る

息子は「お父さんずドヌナツ」を芋逃すこずはありたせん

孊校の日
ステヌキマンはリラックスしなきゃ....
私の友人は2぀のデヌトでプロムに行きたした。

予定通りに進たなかった...


同様の画像の堎合、キャプションはほが同じです。





圌女は矎しい写真を撮るこずができたす

私たちの猫の。 䞀芋できない...
私のラップトップは3埌に写真を撮るように蚭定されおいたす

誀ったパスワヌドの詊行。
この猫はスタヌりォヌズのカむロ・レンのように芋えたす






猫は垞にあなたを奜きに芋たす

あなたはちょうど圌らに乗るために圌らに尋ねたした

空枯
私のラップトップは3埌に写真を撮るように蚭定されおいたす

誀ったパスワヌドの詊行。
最高のりェディングギフトに座っおいる猫

圌の顔の写真が描かれた毛垃を受け取った...


その結果、成功䟋ず悪い䟋の比率は玄1察10であるこずが刀明したした。これは、普遍的な眲名の数が少ないこずず、トレヌニングセットに含たれるミヌムの割合が倧きいこずによっお説明される可胜性が高いです。



眲名生成WordRNNアプロヌチ



この方法の基瀎は、 各局がLSTMである2局リカレントニュヌラルネットワヌクです 。 このようなネットワヌクの䞻な特性は、次の倀が前の倀に䟝存する時系列を掚定する機胜です。 次に、眲名はそのような時系列です。



このネットワヌクは、テキスト内の次のすべおの単語を予枬するようにトレヌニングされたした。 トレヌニングサンプルでは、​​眲名の党䜓が取埗されたした。 このようなネットワヌクは、䜕らかの意味で意味のある、たたは少なくずも面癜い眲名を生成する方法を孊習できるず想定されおいたした。



最初の単語だけが尋ねられ、残りは生成されたした。 結果は次のずおりです。

トランプ  トランプ猫」宇宙で唯䞀のものに぀いおほずんど怖がっお友達になった

Obama obama LAUGHING drop FAVORITE 4rd FAVORITE 4rd fucking long

アゞア人 アゞア人のRR IIの倖芳は私に芋えたすあなたがそれを着おいる灰色のキャンディヌテクノロゞヌを手に入れたず思う前に

猫 猫䞎えるだけでりェむタヌが蚀ったずき*圌のパンでケヌキを感じおいるのを聞いた

車 車のシャキッずした“゚マお願いしたす” BUS 89スタヌタヌはピザのペニスが足りないので倱望したすか

先生 先生、それは出お行かないず感じたからです。



予想に反しお、受け取った眲名はむしろ蚀葉の集たりでした。 䞀郚の堎所では、文の構造はかなりよく暡倣されおおり、個々の郚分は意味がありたした。



マルコフ連鎖を䜿甚した眲名生成



マルコフ連鎖は、自然蚀語をモデリングするための䞀般的なアプロヌチです。 マルコフ連鎖を構築するために、テキストの本文は、単語などのトヌクンに分割されたす。 トヌクンのグルヌプは状態ごずに割り圓おられ、トヌクンずテキスト本文の次の単語ずの間の遷移の確率が蚈算されたす。 生成䞭に、コヌパスの分析で埗られた確率分垃からサンプリングするこずにより、次の単語が遞択されたす。



実装のために、 このラむブラリが䜿甚され、トレヌニングベヌスずしお-ダむアログの眲名がクリアされたした。

改行-新しい眲名。



結果状態-2ワヌド



あなたの盞棒があなたにm 90を蚀ったずき



ドりェむン・ゞョン゜ンずロックは双子です。 圌らがカメを所有しおいる堎合は、ビヌルの猶ず愛囜的な旗の日焌けがありたす。



この男はあなたに珟れたすが、あなたはあなたの䞡芪察私ず同じくらい誀っお冗談を取埗しようずしたす



5分以内に仕事に行く準備をしお、パヌティヌがこれほど明るくないかどうかを刀断したす。 物資を瞫わないでください...



圌のレゎずぶら䞋がっおいるゞャスティン



ママがレポヌトカヌドを9時間喫煙しお雑草を呌んでいるこずに気づいたずき



柔和を救える少女にメッセヌゞを送る

結果状態-3ワヌド



卒業したが宿題の答えを尋ねるのが奜きではないずき



whenいずきはクリ゚むティブになろう



私の犬はい぀か死ぬ぀もりです。



あなたがラゞオでクリスマス゜ングを聞いたが、それが終わったずき



あなたの女の子が出かけ、あなたは圌女があなたに尋ねたように実際に掃陀したした



チャックはプロムクむヌンに150回ブレアを投祚し、より健康的な遞択を開始するこずにしたした。



皿掗いを終えお振り向くず思ったら、ストヌブの䞊にもっずある



同じミヌムを䜕床も芋るず、パスコヌドの信頌を芁求したす。



3぀の単語がある状態では、テキストは2぀の単語よりも意味がありたすが、盎接䜿甚するにはあたり適しおいたせん。 おそらく、眲名を生成するために䜿甚でき、その埌の人による調敎が可胜です。



結論の代わりに



ゞョヌクを曞くアルゎリズムを教えるこずは非垞に難しい䜜業ですが、非垞に興味深いです。 圌女の決定により、知的アシスタントはより「人間的」になりたす。 䟋ずしお、珟圚のバヌゞョンのアシスタントずは異なり、ナヌモアのレベルが調敎され、ゞョヌクが予枬できない映画むンタヌステラヌのロボットを想像できたす。



䞀般に、これらのすべおの実隓の埌、次の結論が導き出されたす。



  1. 眲名を生成するアプロヌチには、テキストの本文、教育方法、モデルのアヌキテクチャを扱う非垞に耇雑で時間のかかる䜜業が必芁です。 たた、このようなアプロヌチでは、結果を予枬するこずは非垞に困難です。
  2. 結果の芳点からより予枬可胜なのは、既存のデヌタベヌスから眲名を遞択するアプロヌチです。 しかし、これには困難が䌎いたす。



    • 意味はアプリオリ情報でしか理解できないミヌム。 このようなミヌムは、他のミヌムず区別するのが難しく、デヌタベヌスに分類されるず、ゞョヌクの品質が䜎䞋したす。
    • 写真で䜕が起きおいるのかを理解する必芁があるミヌムどのような行動、どのような状況。 そのようなミヌムは、再び、ベヌスに萜ちお、品質を䜎䞋させたす。
  3. ゚ンゞニアリングの芳点から、この段階での適切な解決策は、最も人気のあるカテゎリに察しお線集グルヌプがフレヌズを慎重に遞択するこずであるず思われたす。 これはセルフィヌ通垞、人々は自分自身たたは友人や知人の写真でシステムをチェックしたす、有名人トランプ、プヌチン、キムカヌダシアンなどの写真、ペット、車、食べ物、自然です。 たた、カテゎリ「rest」を入力しお、システムが画像に衚瀺されおいるものを認識しない堎合に備えおゞョヌクを甚意するこずもできたす。


䞀般に、今日、人工ゞョヌクはゞョヌクを生成するこずはできたせんすべおの人がこれに察凊できるわけではありたせんがが、自分に合ったものを非垞にうたく遞択できたす。 むベントの開発をフォロヌし、むベントに参加したす



All Articles