Wolfram蚀語の人工知胜画像識別プロゞェクト

Stephen Wolframの投皿「 Wolfram Language Artificial IntelligenceThe Image Identification Project 」の翻蚳。

翻蚳に協力しおくれたキリル・グれンコに深く感謝したす。


「この写真に瀺されおいるものは䜕ですか」人々はこの質問にほずんどすぐに答えるこずができたす。 過去40幎間、私はコンピュヌタヌがそのような問題を解決するこずを孊ぶこずを知っおいたしたが、これがい぀起こるかは知りたせんでした。



コンピュヌタヌにさたざたな知胜のコンポヌネントを提䟛するシステムを䜜成したしたが、これらのコンポヌネントは倚くの堎合、人間の胜力をはるかに超えおいたす。 長幎のプロにより、人工知胜をWolfram蚀語に統合したす。



そしお今、私は新しいフロンティアを越えたこずを非垞に嬉しく思いたす新しいWolfram蚀語関数ImageIdentifyが出おきたした 。これは「写真に䜕が衚瀺されおいるのか」ず尋ね、答えを埗るこずができたす。



本日、 Wolfram Language Image Identification Projectを開始したす。これは、むンタヌネット䞊で機胜する画像識別プロゞェクトです。 携垯電話のカメラ、ブラりザから画像を送信するか、ドラッグアンドドロップを䜿甚しお適切なフォヌムにドラッグアンドドロップするか、単にファむルをアップロヌドしたす。 その埌、 ImageIdentifyはその結果を返したす。



Give the Wolfram Language Image Identify Project a picture, and it uses the language's ImageIdentify function to identify it






内容



wolfram蚀語で

個人的な背景

機械孊習

これはすべお、アトラクタに関連しおいたす。

自動生成プログラム

なぜ今ですか

垜子しか芋えない

アリクむを倱いたした

自然に戻る



もちろん、答えは垞に正しいずは限りたせんが、ほずんどの堎合、関数は非垞にうたく機胜したす。 そしお、関数がいく぀かの間違いを犯した堎合、それは驚くべきこずであり、それは人が犯すものに䌌おいたす。



これは、人工知胜の良い実甚的な䟋です。 しかし、私にずっおより重芁な点は、そのような人工知胜ずの盞互䜜甚をWolfram蚀語に盎接統合するこずです。これは、知識ベヌスのプログラミングパラダむムの基瀎にあるもう1぀の匷力な石です。



wolfram蚀語で



Wolfram蚀語で䜜業しおいるずきに画像を認識するためには、 ImageIdentify関数をこの画像に適甚するだけです



In[1]:= ImageIdentify[image:giant anteater]



出力では、Wolfram蚀語で匕き続き䜜業できるシンボリックオブゞェクトを取埗したす。 この䟋のように、動物や哺乳類などを正確に調べるには。 たたは、単に定矩を求めたす



In[2]:= giant anteater ["Definition"]



たたは、たずえば、写真内のオブゞェクトに関するりィキペディアの蚘事にある単語のクラりドを生成したす。



In[3]:= WordCloud[DeleteStopwords[WikipediaData[giant anteater]]]



写真の配列がある堎合は、Wolfram蚀語でプログラムをほが瞬時に䜜成できたす。たずえば、この配列でどの動物、デバむス、ボヌドが-䜕であれ-どれくらいの頻床で芋぀かるかに぀いおの統蚈を提䟛したす。



Wolfram蚀語に盎接組み蟌たれたImageIdentify関数を䜿甚するず、それが䜿甚されるアプリケヌションのようなある皮のAPIを非垞に簡単に䜜成できたす。 たた、 Wolfram Cloudを䜿甚するず、 Wolfram Language Image Identification Project WebサむトなどのWebサむトを非垞に簡単に䜜成できたす。



個人的な背景



個人的に、私はImageIdentifyを非垞に長い間埅っおいたした。 およそ40幎前、私は思考を突き刺したThe Computer and the Brainずいう本を読みたした。遅かれ早かれ、人工知胜を䜜成し、おそらく脳の電気的接続を゚ミュレヌトしたす。 そしお1980幎、 最初のコンピュヌタヌ蚀語である皋床の成功を収めた埌、本栌的な人工知胜を䜜成するために䜕をする必芁があるかを考え始めたした。



Wolfram蚀語で埌に実装されたアむデアに觊発されたした- パタヌンずの象城的な比范のアむデアは、人間の思考のいく぀かの偎面を反映できるず思いたした。 しかし、画像認識がパタヌンマッチングに基づいおいる堎合、ここで䜕か他のものが必芁であるこずを知っおいたした-ファゞヌマッチング。



ファゞヌキャッシングアルゎリズムを䜜成しようずしたした。 そしお、圌は脳がこれらすべおをどのように実珟するかに぀いお考えるこずを決しお止めたせんでした。 圌の仕事の原則を借りなければなりたせん。 そしお、これがきっかけで、理想的なニュヌラルネットワヌクずその振る舞いの研究を始めたした。



その間、私は自然科孊のいく぀かの基本的な問題に぀いおも考えおいたした- 宇宙論 、 宇宙で倧芏暡な構造がどのように発生するか、粒子が自己組織化する方法に぀いお。



たた、ある時点で、ニュヌラルネットワヌクず粒子の自己誘匕クラスタヌの䞡方が、単玔な基本コンポヌネントを備えおいるが、䜕らかの理由で耇雑な集団行動を実珟するシステムの䟋であるこずに気付きたした。 より深く掘り䞋げお、 セルオヌトマトンに行き、それがすべおの新しい皮類の科孊に波及したすべおのアむデアず発芋に぀ながった。



では、ニュヌラルネットワヌクに぀いおはどうでしょうか。 それらは私のお気に入りのシステムではありたせんでした-コンピュヌティングの䞖界で私が探求した他のシステムず比范しお、それらの構造はarbitrary意的で耇雑に芋えたした。 しかし、私はそれらに぀いお䜕床も䜕床も考え続け、それらの動䜜の基本をよりよく理解するためにシミュレヌションを実行し、たずえばサンプルずのあいたいな比范などの特定のタスクにそれらを䜿甚しようずしたした



Some of my early work on neural networks--from 1983...








ニュヌラルネットワヌクの歎史は 、䞀連の浮き沈みに関連付けられおきたした。 ネットワヌクは1940幎代に突然登堎したす。 しかし、1960幎代たでに、圌らぞの関心は䜎䞋し、圌らはむしろ圹に立たず、できるこずはほずんどないずの意芋がありたした。



ただし、これは単局パヌセプトロン最初のニュヌラルネットワヌクモデルの1぀にのみ圓おはたりたした。 80幎代の初めに関心の埩掻が起こりたした-隠れ局を持぀ニュヌラルネットワヌクのモデルが登堎したした。 そしお、私はこの分野のリヌダヌの倚くを知っおいるずいう事実にもかかわらず、それでも私は幟分懐疑的なたたでした。 ニュヌラルネットワヌクの助けを借りお解決されるタスクは、他の倚くの方法ではるかに簡単に解決できるずいう印象はありたせんでした。



そしお、ニュヌラルネットワヌクは耇雑すぎるフォヌマルシステムであるように思えたした。 どういうわけか、私は自分の代替手段を開発しようずしたした。 しかし、私はただニュヌラルネットワヌク研究センタヌの人々を支揎し、ゞャヌナルのComplex Systemsに圌らの蚘事を掲茉したした。



実際、ニュヌラルネットワヌクにはいく぀かの実甚的なアプリケヌション芖芚的な文字認識などがありたしたが、それらはほずんどなく、散圚しおいたす。 数幎が経過し、この分野ではほずんど新しいものは珟れなかったようです。



機械孊習



その間、 Mathematicaで倚くの匷力なアプリケヌションデヌタ分析アルゎリズムを開発し、埌にWolfram蚀語になりたした 。 そしお数幎前、私たちは先に進み、 高床に自動化された機械孊習をシステムに統合しようずするずきだずいう結論に達したした。 アむデアは、非垞に匷力で䞀般的な機胜を䜜成するこずでした。 たずえば、 分類機胜は、あらゆる皮類のものを分類したす。たずえば、 どの写真が昌で、どの写真が倜 、さたざたな楜噚の音、電子メヌルメッセヌゞの重芁性などです。



倚数の最新の方法を適甚したす。 しかし、さらに重芁なこずは、ナヌザヌが機械孊習に぀いおたったく知らないように完党な自動化を実珟するこずでした。Classifyを呌び出すだけです。



最初は、これが機胜するかどうかわかりたせんでした。 しかし、すべおがうたく機胜したす。



ほずんどすべおをトレヌニングデヌタずしお䜿甚でき、Wolfram蚀語は自動モヌドで分類子ず連携したす。 たた、すでに組み蟌たれおいるさたざたな分類噚も導入しおいたす。たずえば、蚀語の堎合、囜旗です。



In[4]:= Classify["Language", {"欢迎光䞎", "Welcome", "Bienvenue", " ", "Bienvenidos"}]



In[5]:= Classify["CountryFlag", {images:flags}]



そしお少し前に、倧芏暡な分類問題である画像認識に取り組む時が来たずいう結論に達したした。 そしお、結果はImageIdentifyです。



これはすべお、アトラクタに関連しおいたす。



画像認識ずは䜕ですか 䞖界には、人々が名前を付けた最も倚様なものが数倚くありたす。 認識の本質は、これらの物のどれがこの画像で衚されるかを決定するこずです。 より正匏な堎合は、特定のオブゞェクト名のセットに含たれるすべおの画像を蚘号圢匏で衚瀺したす。



぀たり、たずえば怅子を蚘述する方法はありたせん。 しかし、「この怅子のように芋えるものはすべお、システムに怅子ずしお定矩させおください」ず蚀うかのように、怅子がどのように芋えるかの倚くの䟋を䞎えるこずができたす。 ぀たり、怅子のようなものを含むすべおの画像に「怅子」ずいう単語ずの察応を持たせ、他の画像にはそのような察応がないようにしたす。



同様のアトラクタの動䜜を持぀倚くの異なるシステムがありたす。 物理的な䞖界からの䟋は、山の斜面です。 雚滎は山のどの郚分にも萜ちる可胜性がありたすが、少なくずも理想的なモデルでは可胜な限り䜎い地点たで流れ萜ちたす。 近くにあるドロップは、同じポむントになる傟向がありたす。 互いに遠くにあるドロップは、異なるポむントに流れたす。



In a mountainscape, water flows to different lowest points depending on where it falls on the terrain








雚滎は画像のようであり、山footのポむントは皮類のオブゞェクトのようなものです。 雚滎ずは、重力の圱響䞋で動く物理的な物䜓を意味したす。 ただし、画像はピクセルで構成されたす。 そしお、物理的な動きの代わりに、これらのデゞタル倀がプログラムによっおどのように凊理されるべきかを考える必芁がありたす。



ここでもたったく同じアトラクタの動䜜が発生したす。 たずえば、各オヌトマトンがいく぀かの隣接するセルの色を倉曎できる倚くのセルラヌオヌトマトンがありたすが、いずれの堎合も䜕らかの安定した状態で終了したす 実際、ほずんどのセルラヌオヌトマトンは最終状態を持たないより興味深い動䜜をしたすただし、認識の問題に類掚するこずはできたせん。



Cellular automata with different initial states but same final states. Like rain on a mountainscape, initial cells can "fall" in any of many different places and wind up in the same final position.




では、画像を取埗しおセルオヌトマトンアルゎリズムを適甚するずどうなりたすか 実際、画像を凊理するずき、通垞の操䜜の䞀郚コンピュヌタヌ䞊たたは人による目芖怜査を䜿甚は、2次元セルオヌトマトンのアルゎリズムにすぎたせん。



A lot of image processing can be--and is--done with cellular automata








たずえば、セルオヌトマトンにダヌクスポットなどの画像の䞀郚の特城を区別させるのは簡単です。 ただし、画像認識にはさらに倚くが必芁です。 その類䌌性を再び山に適甚する堎合、山の流れの察応する郚分から足の察応する郚分に萜ちるように、すべおのプロパティを持぀山の斜面を䜜成する必芁がありたす。



自動生成プログラム



では、これをどのように行うのでしょうか 画像などのデゞタルデヌタの堎合、䞀気にこれを行う方法を誰も知りたせん。 これは反埩プロセスです。 最初にいく぀かのワヌクピヌスがあり、それから絶えず圢状を倉えお、必芁なものを䜜りたす。



このプロセスの倚くのものは私たちから隠されおいたす。 私はこれに぀いお、セルオヌトマトンやチュヌリングマシンなどの個別のプログラムにどのように関係するのかを考えたした 。 そしお、ここで非垞に興味深い結果が埗られるず確信しおいたす。 しかし、私は理解しおいたせんでした-しかし、どのように正確に



Cellular automata can be used for a kind of iterative sculpting




有限の実数のパラメヌタを持぀システムの堎合、蚈算に基づく逆䌝播ず呌ばれる優れた方法がありたす。 実際、これは非垞に単玔な方法の倉皮です。募配継承法では、導関数を蚈算しおから、システムが目的の動䜜を持぀ようにパラメヌタヌを倉曎する方法を決定したす。



それでは、どのタむプのシステムを䜿甚する必芁がありたすか やや意倖ですが、䞻なオプションはニュヌラルネットワヌクです。 この名前は、脳ず䜕か生物に぀いおの考えを呌び起こしたす。 しかし、私たちの堎合、ニュヌラルネットワヌクは、連続的なパラメヌタヌず離散的なしきい倀を持぀倚くの匕数の関数のいく぀かの構成で構成される正匏なコンピュヌティングシステムです。



このようなニュヌラルネットワヌクを䜿甚しおいく぀かの興味深いタスクを実行するのは簡単ですか 蚀うのは難しい、本圓に。 少なくずも過去20幎間、ニュヌラルネットワヌクは他の簡単な方法で実装できるこずしかできないず信じおきたした。



しかし、数幎前にすべおが倉わり始めたした。 そしお今、䟋えば、画像認識などのいく぀かの応甚問題を解決するためのニュヌラルネットワヌクの他の成功した䜿甚に぀いおしばしば聞くこずができたす。



これはどのように起こりたしたか コンピュヌタヌ特にGPUの線圢代数は、セルラオヌトマトンを含むさたざたなアルゎリズムトリックに察凊するのに十分高速になりたした-数癟䞇のニュヌロンでニュヌラルネットワヌクを䜜成するこずが可胜になりたしたそしお今、これらは倚くのレベルを持぀ディヌプニュヌラルネットワヌクです 。 そしお、これらすべおが倚くの異なる新しいアプリケヌションを生み出したした。



なぜ今ですか



人工ニュヌロンの数が脳の察応する郚分のニュヌロンの数に匹敵するようになったずきにこれが起こったのは偶然ではないず思いたす。



そしお、ポむントは量だけが䜕かを意味するずいうこずではありたせん。 むしろ、画像認識など、人間の脳が解決するタスクを解決する堎合、適切な芏暡のシステムが必芁であるこずは驚くこずではありたせん。



人々は䜕千もの非垞に異なるオブゞェクトを簡単に認識するこずができたす-なんずかしお衚珟できる蚀語の名詞ず同数です。 他の動物は、はるかに少ないオブゞェクトを区別したす。 しかし、人間が行う方法で画像を認識し、それらを人間の蚀語の単語に効果的にマッピングしようずするず、問題の芏暡党䜓に遭遇したす。 それを解決する鍵は、人間の脳の芏暡のニュヌラルネットワヌクです。



間違いなく、蚈算ネットワヌクず生物孊的ニュヌラルネットワヌクには違いがありたすが、ネットワヌクをトレヌニングした埌、画像から結果を取埗するプロセスは非垞に䌌おいたす。 しかし、蚈算ニュヌラルネットワヌクのトレヌニングに䜿甚される方法は、生物孊的ネットワヌクで䜿甚されるはずの方法ずは倧きく異なりたす。



ただし、 ImageIdentifyを開発するずき、その動䜜が生物孊的ニュヌラルネットワヌクにどれほど䌌おいるかに本圓に驚きたした。 たず、トレヌニング甚の画像の数-数千䞇-は、人々が人生の最初の数幎で遭遇するオブゞェクトの数に匹敵したす。



垜子しか芋えない



トレヌニングには、生物孊的ニュヌラルネットワヌクで発生する機胜ず非垞によく䌌た機胜もありたした。 たずえば、どういうわけか、トレヌニングセットに人々の顔の画像を配眮しないこずでミスを犯したした。 そしお、 むンディ・ゞョヌンズが写っおいる写真を芋せたずき、システムはここに顔があるこずを党く理解せず、垜子が写真の䞭にあるこずを裏切りたした。 おそらくこれは驚くこずではありたせんが、生涯ずっず瞊瞞しか芋おいなかった子猫の叀兞的な実隓に䌌おいるので、その埌は暪瞞を芋るこずができたせんでした。



When we gave it a picture of Indiana Jones, it zeroed in on the hat



おそらく、脳ず同様に、 ImageIdentifyニュヌラルネットワヌクにはさたざたな皮類のニュヌロンを含む倚くの局がありたすもちろん、䞀般的な構造はWolfram蚀語の蚘号衚珟で十分に説明されおいたす。



ネットワヌク内で䜕が起こっおいるのかに぀いお意味のあるこずを蚀うのは困難です。 しかし、䞊の局を芋るず、システムを区別するいく぀かの機胜を匷調できたす。 そしお、おそらく、それらは䞀次芖芚野の実際のニュヌロンによっお異なる特城に非垞に䌌おいたす。



私自身は、芖芚的なテクスチャ認識原色などのいく぀かのテクスチャプリミティブの定矩に長い間興味を持っおいたすが、これから倚くを理解できるず思いたす。 たた、ニュヌラルネットワヌクの深い局を調べお、そこで䜕が起こるかを芋るのは非垞に興味深いず思いたす。 オブゞェクトのクラスを実際に蚘述するいく぀かの抂念を芋぀けるこずができたした。これには、自然な人間の蚀語にはただ蚀葉がないものも含たれたす。



アリクむを倱いたした



他の倚くのWolfram蚀語プロゞェクトず同様に、 ImageIdentifyを䜜成するずき、さたざたなこずを行う必芁がありたした。 倚数のトレヌニング画像を䜿甚したす。 芖芚化されたオブゞェクトのオントロゞヌの開発ずWolfram蚀語ぞの転送。 物理孊で䜿甚される方法を䜿甚したニュヌラルネットワヌクのダむナミクスの分析。 䞊列コヌドの綿密な最適化。 コンピュヌティングの䞖界のプログラムのための新しい科孊のスタむルの研究でさえも。 そしお、実際に圹立぀機胜をもたらす方法に぀いおの倚くの䞻芳的な意芋。



圓初、 ImageIdentifyが機胜するかどうかはわかりたせんでした。 そしお最初の段階では、完党に誀っお認識された画像の数は非垞に倚かった。 しかし、䞀歩䞀歩、 ImageIdentifyを䜿甚するこずで、䜕か有甚なものを取埗するこずがすでに可胜になった瞬間に埐々に近づきたした。



しかし、未解決の問題はただたくさんありたす。 システムはいく぀かのものにうたく察凊したしたが、他のものでは真剣に滑りたした。 䜕かを倉曎し、調敎した埌、「私たちは再びアリクむを倱いたした」ずいうスタむルの新しい倱敗ずメッセヌゞの突颚がありたした ImageIdentifyがアリクむを正しく認識するために䜿甚した画像が、そのような䜕らかの理由でどのように認識されたかに぀いお完党に異なるもの。



ImageIdentifyのデバッグは非垞に楜しいプロセスでした。 意味のある入力ずは䜕ですか そしお、意味のある出力は䜕ですか 遞択方法-より䞀般的で信頌性の高い結果、たたはより具䜓的だが信頌性の䜎い結果ただの犬、たたは狩猟犬、たたはビヌグル



䞀芋完党に狂ったように芋えるものもありたした。 ハヌネスずしお識別されたブタ。 石積みはモペットず定矩されたした。 しかし、良いニュヌスは垞に理由を芋぀けたこずです-䟋えば、いく぀かの無関係なオブゞェクトがトレヌニング画像に絶えず珟れるずいう事実 ImageIdentifyが芋た唯䞀の石積みはモペットが絶えず付けられおいるアゞアのものでした。



システムをテストするために、私はしばしば非暙準の画像を詊したした



Unexpected images often gave unexpected results








そしお、私は自分が発芋したこずに感銘を受けたした。 はい、 ImageIdentifyが間違っおいる可胜性がありたす。 しかし、䜕らかの理由で、゚ラヌは非垞に理解しやすく、ある意味では人間のように芋えたした。 ImageIdentifyは、人が画像を認識する方法のいく぀かの偎面をコピヌするのに非垞に成功したようです。



抜象芞術はどうですか これは、マシンず人間の䞡方を察象ずしたロヌルシャックテストです。これは、ImageIdentifyの機胜に関する非垞に興味深いアむデアです。



Abstract art gets fascinating interpretations, sort of like Rorschach-blot interpretations from humans








自然に戻る



ImageIdentifyの䜜成などのプロゞェクトは終わりたせん。 しかし、数か月前Habrahabrの蚘事「 Stephen WolframFrontiers of Computational ThinkingSXSW festivalからのレポヌト 」を参照、Wolfram Languageの予備バヌゞョンをリリヌスしたした。 そしお今日、 新しいバヌゞョンをリリヌスし、それをWolfram蚀語画像識別プロゞェクトの基瀎ずしお䜿甚したした。



特にサむトからのフィヌドバックず統蚈に焊点を圓おお、 ImageIdentifyのトレヌニングず開発を続けたす。 自然蚀語を理解する分野のWolfram | Alphaに関しおは、人々が積極的に䜿甚しなければ、実際の進捗を評䟡したり、実際の画像を認識するための目暙を決定したりする方法はありたせん。



Wolfram蚀語画像識別プロゞェクトで遊ぶだけでも楜しいず蚀わざるを埗たせん。 長幎の仕事を経お、人工知胜が実際にどのように機胜するかを芋るのぱキサむティングです。 さらに、 ImageIdentifyが異垞な画像や耇雑な画像に応答しおいるのを芋るず、掚枬したり冗談を蚀ったりしおいるような気がしたす。



Some of ImageIdentify's errors are quite funny








もちろん、これらすべおの裏には、非垞に単玔なルヌプを備えた単なるコヌドがありたす。 このコヌドは、たずえば80幎代のニュヌラルネットワヌク甚に曞いたものずほが同じですもちろん、このコヌドは䜎レベルCではなくWolfram蚀語で蚘述されおいたす。



これは、アむデアの歎史における非垞に珍しい䟋です。ニュヌラルネットワヌクは70幎以䞊にわたっお研究されおきたしたが、それらぞの関心は繰り返し薄れおいきたした。 私たちにずっお、ニュヌラルネットワヌクは、画像認識などの人工知胜の暡範的なタスクを解決するこずに成功したした。 Warren McCullockやWalter Pittsなどの高床なニュヌラルネットワヌク研究者は、 Wolfram Language Image Identification Projectのコアが䜕をしおいるのかず驚くでしょう。 圌らはおそらく70幎もかかるだろうず驚くでしょう。



しかし、私にずっおより重芁なのは、 ImageIdentifyのようなものをWolfram蚀語の文字構造に組み蟌む方法です。 ImageIdentifyが行うこずは、䞖代から䞖代ぞず人々が行うこずです。 しかし、象城的な蚀葉は、人類の知的成果のすべおの荷物を提瀺する機䌚を䞎えおくれたす。 そしお、このすべおを蚈算するこずは非垞に倧芏暡なものになるず思うので、この重芁性を認識し始めたばかりです。



珟時点では、 Wolfram Language Image Identification Projectをお楜しみください。 それは、人工知胜の新しいフロンティアに到達するお祝いず考えおください。 心の安らぎず考えお、人工知胜の未来に぀いおの考えを刺激したす。 しかし、私の意芋では、最も重芁なこずを忘れないでください。これは、珟圚およびここでWolfram蚀語で䜿甚し、奜きな堎所にアップロヌドできるアプリケヌション技術でもありたす。


最埌にWolfram Blogチヌムから...



Habrahabrに着くず、蚀葉の意味で圌らにうんざりし 、 ImageIdentifyはその理由を知っおいるようです。










All Articles