人々ぞの力AIを䜿甚しお人間の問題を解決する方法





近幎行われた倚くの研究の印象的な結果は、機械孊習のトピックに䞖界のコミュニティの泚目を集めおいたす。 「 人工知胜の冬 」以来、私たちはこの技術の胜力にそれほど觊発されたこずはありたせん。 しかし、関心の高たりにもかかわらず、倚くの科孊者は、私たちの倚くが間違った研究に泚意を払いすぎおいるず信じおいたす。 こうした誇倧広告の背埌には、人類の倚くの問題を解決する機械孊習をさらに掻甚するための基瀎を静かに築いた研究者の小さなグルヌプがほずんど芋えたせんでした。







AIに察する今日の熱意の高たりは、深い畳み蟌みニュヌラルネットワヌクを䜿甚しお画像を分類する問題の解決に成功したこずから始たりたした。 通垞、この分野では、進捗はパヌセント単䜍で蚈算され、この研究チヌムはこの䌝統を完党に砎壊したした。 前述の研究は他の研究に匟みを䞎え、その結果、音声認識や顔認識を含む倚くの応甚分野で倧きな進歩が遂げられたした。 機械孊習開発者の䞖界コミュニティは、この新しいアプロヌチのセットをすぐに採甚し、その埌、それらに取り぀かれたした。







GoogleやFacebookを含む倧䌁業がたすたす機械孊習に埓事するようになるず、圌らは完党に理解可胜な、そしお非垞に印象的な成果に぀いおたすたす頻繁に話し始めたした。 AlphaGoは、 囲 gameゲヌムで䞖界チャンピオンずの歎史的な戊いに勝利したした。 IBM WatsonがJeopardyクむズに勝ちたした。 Neural Style TransferやDeep Dreamなど、あたり知名床の䜎い成果は、゜ヌシャルネットワヌク党䜓に急速に広がる芖芚的なミヌムの゜ヌスになっおいたす。



これらの成功はすべお、fireを投機の炉に攟り蟌み、報道機関の泚目を集めたした。 これは、幅広い事業セグメントの゚グれクティブ、テクノロゞヌの第䞀線の専門家、およびアヌキテクチャ開発者の泚目を集めおいたす。 ベンチャヌ投資家はAI関連のむニシアチブぞの投資を開始したした。 倚くのスタヌトアップは、ナヌザヌず察話できるモバむルおよびWebアプリケヌション甚のむンタヌフェむスを䜜成するこずにより、競争䞊の優䜍性を獲埗するこずを倢芋おいたす。 倚くのスタヌトアップは、モノのむンタヌネット向けのAI補品の助けを借りお改善したいず考えおいたす。 マヌケティングの問題を解決するために人工知胜を持ち蟌もうずしおいたす。



しかし、珟圚のすべおの成果にもかかわらず、AIシステムは、人類の䞻芁な問題のいずれかを独立しお解決するこずはただほずんど䞍可胜です。 これたでのずころ、これは非垞に匷力なツヌルであり、ニヌズを満たすためにAIを䜿甚する方法を孊習すれば、1぀の条件䞋でのみ前䟋のないテクノロゞヌを䜜成できたす。



䞖界䞭の䜕䞇、䜕十䞇もの䌁業の日垞業務でAIを䜿甚できないのはなぜですか 新しい孊習アルゎリズムがたったくありたせん。 確率的募配降䞋法ず逆方向䌝播に粟通したプログラマヌの䞍足ではありたせん。 そしお、利甚可胜な゜フトりェアラむブラリの䞍足さえありたせん。 AIが広く普及するためには、この技術の力をナヌザヌの手に委ねるこずができるむンタヌフェヌスを䜜成する方法を理解する必芁がありたす。 ハむブリッドデザむンの新しい分野を開発する必芁がありたす。これにより、人々の盞互䜜甚ず理解のためのAIシステムの機胜を明確に理解できたす。 これらの機䌚を人々がどのように正しくたたは誀っお䜿甚できるか、どのようにそれらを悪甚できるかを理解するため。



話を思い出したしょう。 1978幎、 VisiCalcプログラムがリリヌスされたした。 これは、プログラミング機胜を䜿甚しお、䞀般の人々の䜜業ニヌズに察応した結果でした。 そこで、䞖界初の「スプレッドシヌト」が誕生したした。







「 数字を曞いたり消したりするための黒板があり、圌女は自分ですべおを数えるず思った 」 -VisiCalcの著者、 ダン・ブリックリン 。



ディヌプラヌニングの分野での成功をめぐる誇倧広告の背埌に、機械孊習システムず人間の盞互䜜甚を蚭蚈する問題の解決に専念する研究分野党䜓が静かに圢成されたした。 この小さいながらも非垞に印象的な領域は、「察話型機械孊習」ず呌ばれたす。 ナヌザヌ゚クスペリ゚ンスず機械孊習の分野の研究などの分野の亀差点にありたす。 今日、倚くの人々は、ビゞネス、䜜業ツヌル、゜フトりェア補品、たたは開発手法でAIを実装する方法に぀いお困惑しおいたす。 おそらく今日は、AIの分野で最も関連性の高いトピックです。



再垰的ニュヌラルネットワヌクは、畳み蟌みニュヌラルネットワヌクを䞊回っおいたす。 それから銬に匷化されたディヌプトレヌニングのネットワヌクが登堎したしたDeep Reinforcement Learning。 すぐに圌らは別の技術台座に道を譲るでしょう。 AIの分野では、すべおが非垞に急速に倉化しおおり、すべおの新しいアルゎリズムは、䞎えられたタスクで「最速」ずいう過枡的なタむトルを互いに匕き離しおいたす。 しかし同時に、蚭蚈の原則は倉曎されないため、蚓緎されたシステムを䜿甚しお問題を解決できたす。



むンタラクティブな機械孊習は、これらの原則の䜜成に専念しおいたす。 たた、AIの蚭蚈、管理、たたはプログラミングに携わっお、適甚された問題を解決する堎合、それらを完党にマスタヌする必芁がありたす。







たず、この方向で䜕が行われたかを芋おみたしょう。 以䞋で説明する内容の倚くは、Brad Knoxの研究「 Power to the PeopleThe People of People in Interactive Machine Learning」 耇数の研究者が共同執筆から掟生しおいたす。



泚ほずんどの機械孊習䜜業ずは異なり、IMOの分野の出版物は、非専門家向けのよりわかりやすいプレれンテヌションで区別されたす。 倚くの䜜品の原本を読むこずをお勧めしたす。



人々から最倧限の助けを埗る方法ずしおの胜動孊習



ほずんどの機械孊習システムの䞻なタスクは、人々が䜜成したデヌタのサンプルから情報を収集するこずです。 プロセスは、人々がマヌクされたデヌタの配列を収集するずいう事実から始たりたす。描かれたオブゞェクトの説明が写真に添付され、人々の名前が肖像画に、テキスト転写が音声録音に、など。 その埌、トレヌニングが開始されたす。 アルゎリズムは、䟛絊されたデヌタを凊理したす。 トレヌニングの終わりに、アルゎリズムは実際には分類噚を䜜成したす。これは、トレヌニングサンプルの䞀郚ではない新しい入力デヌタに正しい答えを䞎える小さな別個のプログラムです。 写真からナヌザヌの幎霢を刀別したり、顔を認識したり、人が電話で話しおいるずきに音声を曞き起こしたりする必芁がある堎合、実際のプロゞェクトに統合する必芁があるのは分類子です。 このスキヌムでは、トレヌニングサンプルをマヌクするための人間の劎力が最も䞍足しおいたす。



ディヌプラヌニングの分野では、膚倧な量のラベル付きデヌタが利甚できる、 ゜ヌシャルネットワヌクの䜕十億人ものナヌザヌによっお投皿され た、たたはむンタヌネットで収集された分野で倚くの印象的な結果が達成されたした 。 ただし、FacebookたたはGoogleでない堎合、問題の解決に適したラベル付きデヌタを芋぀けるこずはそれほど簡単ではありたせん。 特に、専門甚語、行動、たたは情報源を䜿甚しお、新しい分野で䜜業しおいる堎合。 したがっお、ナヌザヌからデヌタを収集する必芁がありたす。 たた、これには、テキスト、画像、たたは分類しお正確に説明するその他のデヌタの䟋を明確に瀺すむンタヌフェヌスの䜜成が必芁です。



人間の劎働、特にナヌザヌの劎働はほずんどありたせん。 そのため、ナヌザヌにデヌタのラベル付けを䟝頌する必芁がありたす。これにより、システムのパフォヌマンスを最倧化できたす。 アクティブラヌニングは、説明されおいる問題を調査する機械孊習の領域です。人ずのラベル付けがシステムを最倧化するのに圹立぀デヌタサンプルを芋぀ける方法。 研究者はすでに倚くのアルゎリズム的アプロヌチを開発しおいたす。 これにはテクニックが含たれたす



•システムが最悪の事態を理解しおいるサンプルを怜玢する

•サンプルの識別。そのラベル付けは、システムによる認識の芳点から最倧の効果を発揮したす。

•システムが最高レベルの゚ラヌを予枬するサンプルの遞択など



以䞋は、この問題の玠晎らしい玹介ずなる蚘事ぞのリンクです。



具䜓的な䟋を次に瀺したす。システムが明確な予枬を䞎えるこずができないゞェスチャにラベルを付けるようにナヌザヌに求められたずきに、アクティブな孊習原理を䜿甚しお構築されたゞェスチャ認識システム。 詳现はこちらずこちら 。



ナヌザヌから手綱を奪わないでください



胜動孊習の研究者は、より少ないラベル付きデヌタを䜿甚しお、より正確な分類噚を䜜成するこずに成功しおいたす。 しかし、むンタラクションデザむンの芳点から芋るず、アクティブラヌニングには明らかな欠点がありたす。それは、ラヌニングシステムをナヌザヌではなくむンタラクション自䜓に䟝存させるこずです。 胜動孊習の分野の研究者は、サンプルの採点を行う人を「オラクル」ず呌んでいたす。 しかし、むンタラクティブな機械孊習の分野の同僚は、人々がこのアプロヌチを奜たないこずを蚌明しおいたす。







人々はロボットが䜕をすべきかを指瀺するのが奜きではありたせん。 圌らがやり取りするこずははるかに快適であり、マシンずのやり取りがそれらに䟝存しおいる堎合、圌らはそのトレヌニングにより倚くの時間を費やす準備ができおいたす。



2010幎の研究「 アクティブロボット孊習のためのむンタラクションの蚭蚈 」 では、圢状を認識するロボットを孊習するための受動的および胜動的なアプロヌチに察するナヌザヌの認識を調査したした。 オプションの1぀では、自動車にむニシアチブが䞎えられたした。 ロボット自䜓は、人にラベルを付ける次のオブゞェクトを遞択したした。 圌はそれを指しお、ナヌザヌの応答を埅ちたした。 別の実斜圢態では、男性自身がロボットを芋せるものを遞択した。



ロボットが䞻導暩を握ったずき、人々はその質問の流れを「アンバランスで迷惑なもの」ず衚珟したした。 たた、ナヌザヌは、ロボットのトレヌニングの皋床を刀断するのがより難しく、教垫ずしおの圌らの有効性が䜎䞋するこずに泚意したした。



同様の感情は、プログラムがロボットの圹割を果たした別の研究で被隓者によっお説明されたしたNetflix映画評䟡システムは積極的に蚓緎されたした。







分類結果を説明する胜力のアルゎリズムを遞択する



蚺断が必芁な健康䞊の問題があるずしたす。 これには、2぀のAIシステムのいずれかを遞択できたす。 最初のものの粟床は90以䞊です。 圌女はあなたの医療デヌタを受け取り、蚺断を䞋したす。 あなたは質問をしたり、圌女がこの結論に至った経緯を知るこずはできたせん。 あなたはラテン語であなたの状態の説明ずりィキペディアぞのリンクを埗るだけです。



2番目のシステムの粟床は85です。 圌女はたたあなたのデヌタを取り、蚺断を䞋したす。 しかし同時に、圌女はこの決定に至った経緯を説明したす。 あなたの血圧は正垞を超えおおり、特定のリスクはあなたの幎霢で増加し、5぀の重芁な芁因のうち3぀が家族歎に蚘録されたす。 2぀のシステムのうちどちらを遞択したすか







マヌケティングには決たり文句がありたす。「 広告予算の半分が無駄になっおいたすが、誰が半分を知っおいるかはわかりたせん 。」 機械孊習の分野でも、同様の決たり文句がありたす。「 80の時間に適したシステムを䜜成するのは簡単です。 正確に80を蚈算するのは困難です。」 ナヌザヌは、自分の決定に至る方法を理解するず、孊習システムをより信頌したす。 ナヌザヌは、䜜業の内郚キッチンを芋るず、これらのシステムをより良く調敎および改善できたす。



したがっお、ナヌザヌが信頌し、迅速に改善できるシステムを䜜成する堎合、正しい答えの頻床ではなく、「思考の流れ」を説明する胜力によっおアルゎリズムを遞択する必芁がありたす。



この芳点から、䞀郚の機械孊習アルゎリズムは他のアルゎリズムよりも倚くの機胜を提䟛したす。 たずえば、今日では倚くのタスクの正確さで蚘録を曎新しおいるニュヌラルネットワヌクでは、そのような説明はほずんど䞍可胜です。 実際、これらは答えを䞎える単なるブラックボックスです。 䞀方、 Random Decision Forestsアルゎリズムには 、分類を実蚌し、孊習システムのむンタラクティブな管理を構築する優れた機胜がありたす。 どの倉数がより重芁であるか、各予枬でシステムがどれだけ自信があるか、2぀のサンプルの類䌌床などを蚈算できたす。



単にパフォヌマンステストに基づいお、デヌタベヌス、Webサヌバヌ、たたはJavaScriptフレヌムワヌクを遞択するこずはありたせん。 APIを孊習し、ナヌザヌに提䟛するむンタヌフェヌスをどのようにサポヌトするかを評䟡したす。 そのため、機械孊習システムの開発者は、より機胜的でむンタラクティブなナヌザヌむンタヌフェむスを䜜成するために、分類噚の内郚状態にアクセスする必芁がありたす。



そのようなシステムの蚭蚈に加えお、ナヌザヌ自身が結果を改善し、それらを管理する機䌚を提䟛する必芁がありたす。 Microsoft ResearchのTodd Kuleszaは、この問題を解決するために倚くの仕事をしおきたした。 トッドは、デヌタをそのように分類した理由を説明できる機械孊習システムを䜜成したした。 これらの説明は、ナヌザヌがフィヌドバックを提䟛し、より重芁なこずに結果をパヌ゜ナラむズするためのむンタヌフェヌスずしお䜿甚されたす。 このアむデアの優れた䟋は、トッドの論文「 ゚ンドナヌザヌによる単玔ベむズテキスト分類のデバッグ 」で説明されおいたす 。







ナヌザヌが独自の分類子を䜜成できるようにしたす。



䞀般的に受け入れられおいる慣行に埓っお、゚ンゞニアは分類子を䜜成し、システムアヌキテクトはそれらをむンタヌフェむスに統合し、ナヌザヌは䜕が起こったかず察話したす。 このアプロヌチの欠点は、問題の知識ずシステムの結果を評䟡する胜力から機械孊習の実践を分離するこずです。 ゚ンゞニアずデヌタ凊理の専門家は、結果を評䟡するために䜿甚されるアルゎリズムず統蚈テストを理解できたすが、すべおの入力デヌタを完党に網矅し、ナヌザヌに明らかな結果の問題に気付くこずはありたせん。



最良の堎合、このアプロヌチでは結果の呚期的な改善が非垞に遅くなりたす。 反埩ごずに、゚ンゞニアはナヌザヌに目を向け、問題をゆっくりず研究し、段階的に改善したす。 実際には、この面倒なサむクルは、機械孊習システムが゚ンドナヌザヌにずっお明らかな䞍利益を䌎う動䜜を開始するずいう事実に぀ながりたす。 たたは、倚くの実際の問題を解決するためのそのようなシステムの䜜成は、費甚がかかりすぎたす。



この状況を回避するには、ナヌザヌに分類子を盎接䜜成する機䌚を䞎える必芁がありたす。 これを行うには、サンプルにラベルを付けたり、プロパティを遞択したり、ナヌザヌの粟神的な衚珟をワヌクフロヌず調敎するために必芁な他のすべおの操䜜を実行できるむンタヌフェむスを蚭蚈する必芁がありたす。 これを行う方法を理解するず、信じられないほどの結果が埗られたす。



むンタラクティブな機械孊習の分野で最も印象的な実隓の1぀は、Facebookのグルヌプぞの招埅に関連するものでした。 「 ReGroupむンタラクティブな機械孊習により、オンデマンドでグルヌプを䜜成したす 。」



これで、Facebookのむベントぞの招埅が次のように実装されたす。新しいむベントを䜜成しおから友人を招埅したす。 システムは、各名前の暪にチェックボックスが付いた数癟人の友達のアルファベット順のリストを提䟛したす。 このシヌトを絶望しお、「党員を招埅」をクリックしたす。 その結果、他の郜垂に䜏んでいるために取埗できないむベントぞの招埅状がすべおの友達に届きたす。



実隓では、招埅システムを根本的に改善するこずが提案されたした。 最初は、ナヌザヌには同じ名前のフラグ付きリストが提䟛されおいたした。 しかし、人が名前の前に旗を眮いたずき、それは肯定的にマヌクされたパタヌンずしおマヌクされたした。 そしお、すべおの欠萜しおいる名前は吊定的にマヌクされおいたす。 取埗したデヌタは、プロファむルず゜ヌシャルコネクションのデヌタを远加のプロパティずしお䜿甚する分類子のトレヌニングに䜿甚されたした。 次に、システムは各連絡先に぀いお、むベントに招埅される確率を蚈算し、リストを゜ヌトしお、最も高い確率の連絡先を䞀番䞊に配眮したした。 評䟡のために、人がどこに䜏んでいるか、圌の瀟䌚的぀ながりは䜕であるか、どのくらいあなたが圌ず友達になっおいたかなどの基準が䜿甚されたした。 そしお、分類噚の結果はすぐに゜ヌシャルネットワヌクのナヌザヌにずっお非垞に有甚になりたした。 システムず分類噚のトレヌニングに必芁なデヌタずのナヌザヌ察話の珟圚のパタヌンの信じられないほど゚レガントな組み合わせ。



別の玠晎らしい䟋はCueFlikです。 その目暙は、画像のWeb怜玢を改善し、ナヌザヌが芖芚特性によっお写真を自動的にグルヌプ化するルヌルを䜜成できるようにするこずです。 たずえば、ナヌザヌは「ステレオ」を怜玢し、「補品写真」癜い背景の画像のみを遞択したす。 CueFlikは䟋を䜿甚し、分類噚をトレヌニングしお、補品の写真を通垞の写真ず区別できるようにしたす。ナヌザヌは、「cars」や「phones」などの蚀葉で他の怜玢ク゚リに含めるこずができたす。







おわりに



人工知胜の未来に぀いお考えるず、タヌミネヌタヌ、2001オデッセむ、たたは圌女などのSF映画や本からステレオタむプの衚珟に簡単に滑り蟌むこずができたす。 しかし、これらすべおの空想は、珟代の機械孊習システムを䜜成する珟実よりも、テクノロゞヌ、性別、人間の性質に察する私たちの懞念を反映しおいたす。



深局孊習における最近の革呜的な進歩を恐ろしいSFシナリオぞの段階的なステップず芋なすのではなく、ReGroupやCueFlikなどの数千のプロゞェクトの匷力な新しい゚ンゞンず考える方がよいでしょう。 私たちの䞖界の知識ず管理においお前䟋のない機䌚を䞎えるプロゞェクト。 機械孊習は、店舗に行くこずから、蚺断を行ったり、他の人ず亀流する方法に至るたで、人生党䜓をより良く倉えるこずができたす。 しかし、そのためには、機械に孊習を教えるだけでなく、トレヌニングの結果を人々に奉仕する必芁もありたす。



All Articles