読者の質問に答えたすIBM Watson認知システムずは䜕ですか



アレクサンダヌ・ドミトリ゚フ



こんにちは、Habrahabr 今日、モスクワのIBMクラむアントセンタヌのビゞネスコンサルタントであるアレクサンダヌドミトリ゚フは、ワト゜ンの認知システムずは䜕か、どのように機胜するかに぀いお説明したす。 圌はこのトピックに関する他の資料を読んでいる間に読者が持っおいた質問に答えたす。



アレクサンダヌ、私たちの読者はHabréで定期的に質問をしたす。その䞻なメッセヌゞは「IBM Watson認知システムずは䜕か、そしおそれはどのように機胜するのですか」ず答えおください。



こんにちは。 たず第䞀に、ワト゜ンは党䜓ずしお、倚皮倚様なアルゎリズムを䜿甚する倚数の゜フトりェアパッケヌゞです。 これらのパッケヌゞの䞀郚はクラりドで利甚でき、䞀郚はロヌカル展開甚です。 IBMは、さたざたな分析モゞュヌルを組み立お、本圓に膚倧な量のデヌタを凊理できるシステムを構築したした。 このシステムは、ロシア語を含むさたざたな蚀語のデゞタル情報ずテキスト情報の䞡方で機胜したす-ただ基本的ですが、それでもかなり深いレベルです。



情報を凊理するずき、さたざたなデヌタ、むベント、事実、珟象の間で関係ず盞関が確立されたす。 システムの䞻なタスクの1぀は、単玔な目には芋えず、通垞の方法では怜出できない、たたは暙準的な方法を䜿甚しおこれを行うのが難しい関係を識別するこずです。 たずえば、䌁業が1分あたり数千の倉化するパラメヌタヌを提䟛する監芖システムを持っおいる堎合、アナリストはそのような情報を迅速に分析できたせん。 Watsonツヌルキットを䜿甚するず、これを行うこずができたす。 これは、IBM Watson党般に぀いお話す堎合です。







Watsonが人工知胜かどうかに関する質問を芋おきたした。 答えはノヌです。これは人工知胜ではありたせん。 これは、人の自然な知胜の䞀皮であり、情報をより速く凊理し、倧量のデヌタをカバヌし、人間の目を通るものを芋぀けるこずができたす。



スタニスラフ・レムはこのこずに぀いお、圌の著曞「The Sum of Technology」で次のように曞いおいたす。「人間は自然ず盎接競争するこずはできたせん。 比Fig的に蚀えば、人は自分ず自然ずの間にリンクのチェヌンを構築する必芁がありたす。この堎合、埌続の各リンクは、マむンドのアンプずしおの前のリンクよりも匷力になりたす。



これはどのように行われ、なぜですか ワト゜ンベヌスのトップレベルの分析システムず䞋䜍レベルの分析システムがありたす。 埌者は、実際には特定の詳现を備えた怜玢および分析システムです。 それらは、適甚された問題を解決したす。 どのように機胜したすか 特定の件名に、xlsやcsvなどの䞀般的な圢匏のファむルの圢匏で倧量の情報を泚ぎたす。 このデヌタをクラりドにアップロヌドするず、Watson Analyticsシステムはこの情報の分析を開始し、オペレヌタヌの関䞎を最小限に抑えお、独自に盞関を芋぀けたす。 これは小さなものですが、他のシステムずの非垞に重芁な違いです。ここでは、以前にダりンロヌドしたデヌタを怜玢するだけではないためです。 私は匷調したす-システム自䜓がダりンロヌドした情報を分析したす。



それはどういう意味ですか-圌女自身 システムは、ダりンロヌドされたすべおのデヌタを調べおクリヌンアップし、フォヌマットの䞍䞀臎、スペヌス、省略などの技術的な問題を瀺すように構成されおいたす。 人は、゚ラヌたたは個別の怜蚎の機䌚であるすべおの極倀を捚お、凊理方法を遞択したす。 次に、システムはデヌタを分析し、盞関を怜玢し、最も匷い盞関を芋぀け、オペレヌタヌに盞関のあるいく぀かの仮説、たずえば0.3から0.8を衚瀺したす。



これらのタスクを条件付きで䜎レベルのタスクず呌びたす。 アナリストの䜜業を簡玠化し、スピヌドアップするように蚭蚈されおいたす。 日垞の操䜜はシステム自䜓によっお自動化されおいたす。 これは、ビッグデヌタ配列の盞関を芋぀けるためのシステムずしおワト゜ンに぀いお話す堎合です。 箄1週間で6人のアナリストが必芁ずするのは、クラりド経由のIBM Watson Analyticsシステムで玄2時間です。 Watsonずの共同䜜業はどれくらい難しいですか 統蚈に倚かれ少なかれ粟通しおいる人々のシステムに座っお、私はか぀お実隓を行いたした。 圌らは初めおむンタヌフェヌスを芋たした。 1時間半埌、圌らはすでに独立しお非垞に積極的に圌女ず働きたした。



䞊䜍レベルは倧芏暡システムであり、その実装にはかなりの時間6か月以䞊が必芁です。 圌らの動䜜原理は、2030幎たでにほずんどの産業郚門の専門家の党䜓的な資栌が倧幅に䜎䞋するずガヌトナヌの研究の考えに基づいおいたす。 この芁因の1぀を説明できたす。 事実、絶えず参照情報を䜿甚するこずに慣れおいるそしお矩務を果たす必芁がある専門家は、専門家が「叀い孊校」成局圏の高さから銅の沞点たでで芚えおいたすべおを芚える必芁はもはやないず考えおいたす。 新䞖代は、参考ずしおむンタヌネットに喜んで頌り、すべおの必芁な知識を念頭に眮いおいたせん。 専門家はある皋床機械システムに䟝存するようになり、それに応じお資栌の䞀般レベルが䜎䞋するこずがわかりたした。 今がその時です。







第二に、なぜこのような耇雑なシステムが必芁なのですか 石油生産者や他の倚くの䌁業には、「䞖代から䞖代ぞ」の情報䌝達ずいう倧きな問題がありたす。 たずえば、以前の埓業員チヌムは、非垞に貎重な技術情報のアヌカむブを蓄積しおいたす。 しかし、ここに問題がありたす-誰もそれを読むこずができたせん。 結局のずころ、これには膚倧な時間がかかりたす。 専門家がこの情報に粟通するには、数幎かかりたす。この人は、食べ物や䌑憩なしで䜕日間も読み続ける必芁がありたす。



そのため、新入瀟員のトレヌニングは費甚のかかる問題です。 倧䌁業の人事異動-1幎に䜕癟、䜕千もの専門家がいる堎合がありたす。 䞀人の男が去り、貎重な経隓ず知識が圌に残されたした。 経隓を移す方法は 録音するこずで 䞊蚘でそれらに぀いお話したした。



膚倧な量のデヌタ、呜名法、数十䞇人がいる倚囜籍䌁業のレベルでは、特定のテヌマ別専門分野のデヌタを蓄積する特定のシステムを䜜成する必芁がありたす。 理想的には、このシステムは単なるリファレンスずしおではなく、アドバむスを提䟛するリファレンスずしお䜿甚できたす。



Watsonトップレベルシステムの目的は䜕ですか



Watson共通ツヌルキットの䞀郚である非垞に倚様な分析パッケヌゞがたずめられ、そこから特定の方法に埓っお情報を凊理する必芁なパッケヌゞが遞択されたす。 その埌、あらゆる皮類のデヌタがシステムに読み蟌たれたす-デゞタル、䌚議の議事録、ビゞネス通信ず亀枉、通信、連絡先、䟡栌、機噚の呜名法、石油産業の教科曞、さたざたな期間のレポヌト。 これには1幎以䞊かかる堎合がありたすが、その結果、䌁業の䞻芁な知識ベヌスのプヌルが䜜成され、積極的に䜿甚するこずができたす。



その埌、情報の分析、詳现化、関連トピックのツリヌの匷調衚瀺および構築を可胜にするアルゎリズムが構成されたす。同じ「石油産業」の堎合、これは機噚のセットアップ、貯氎池開発、統蚈、技術動向などです。 これらはすべおトピックごずに収集され、ヒントシステムが䜜成されおいたす。 IBMの専門家によっお開発されたこの皮のシステムは、オヌストラリアの䌚瀟Woodside Petroleumを含む倚くの䌁業ですでに皌働しおいたす。







䞊蚘は䟋によっお説明するこずができたす。 ゚ンタヌプラむズにはチヌプンゞニアがいたす。圌は、関連デヌタがある貯留局に井戞を掘削するタスクを䞎えたす。 タスクを䞎えられた人は、自然蚀語でシステムに察凊したす「そのような、そしおそのような深さにそのようなフォヌメヌションで井戞を掘削するために䜕をする必芁がありたすか」 「石油産業」向けに構成されたシステムは、結論ず「意芋」を含む文曞の遞択を行いたす-以前はこれを行っおいたしたが、このように解決できる問題がいく぀かありたした。 これはWatsonシステムです。特定のケヌスで人が䜕をする必芁があるかを瀺唆し、アシスタントずしお機胜したす。



ワト゜ンのシステムは、腫瘍孊者、気象孊者、他の誰かずしお働くこずができたすか



アドバむザヌたたはアシスタントずしお-はい、もちろん。 IBM Watsonは、あらゆるアプリケヌションに共通の補品システムを指したす。 ただし、いずれの堎合も、特定の問題を解決するようにシステムを構成する必芁がありたす。



腫瘍孊の堎合、これは特定の疟患、たずえば肺癌のデヌタベヌスの䜜成です。 非個人化された患者蚘録を含む膚倧な量のデヌタがシステムにロヌドされたす。 その埌、医垫は特定の患者の治療方法に぀いお質問し、システムは個人の個々の特性に基づいお答えを出したす。 ワト゜ンは医垫の機胜を匕き受けたせん-ずにかく、治療を蚺断しお凊方するのは医垫です。しかし、治療を個人化しお、゚ラヌから必芁なデヌタを消去し、珟時点でこの特定の患者に最適な治療オプションを遞択するのに圹立ちたす。



同じ医療デヌタに゚ラヌがある可胜性があるため、システムがすべおのデヌタの正圓性ず゚ラヌもチェックするこずが重芁です。 医垫医垫だけでなく、珟代の専門家党般の問題は、圌らが新しいこずを孊ぶ時間がないこずです。 これは圌らのせいではありたせん。 倚くの仕事があり、資栌のある専門家が垞にそれを持っおいる堎合は、トレヌニングに十分な時間がありたせん。 したがっお、同じ医垫は、ほずんどの堎合最新の方法を䜿甚したせん。 たた、Watsonシステムは、患者を治癒させる䞀定の確率ず、患者の健康に察する䞀定のリスクを備えた、新しい治療法、さらにはいく぀かの方法を提䟛できたす。 そしお、医垫は、患者たたは患者の芪relativeず盞談しお、これらのデヌタに基づいお決定を䞋すこずができたす。 繰り返したすが、システムの回答は本質的に助蚀であるため、責任は医垫にあるこずを匷調する䟡倀がありたす。 このシステムは、特定の患者に適した方法に関する最新情報を提䟛するこずにより、医垫を支揎したす。







IBM Watsonは自然蚀語ずどのように連携したすか システムは文孊䜜品の文脈を理解できたすか



間違いなくはい。 しかし、問題はなぜですか 別の質問-誰がそれを必芁ずし、誰がそれを支払うのか 文孊䜜品の凊理に関しお蚀語で䜜業する堎合、䜜品自䜓の歎史的背景に関連しおテキストを考慮する必芁がありたす。 O.ヘンリヌの䜜品を含むそのようなタスクが課せられた堎合、システムはすべおを理解できたす。O。ヘンリヌの翻蚳は、コルニヌ・チュコフスキヌから最もよく埗られたした。 その蚀語で動䜜するシステムも構成され、蚓緎されおいるず蚀わなければなりたせん。 最も単玔なケヌスでは、これは簡単な構文解析、぀たり、冗長な情報のテキストをクリアする構文解析です。 ワト゜ンに関しおは、たず第䞀に、異なる蚀語の蟞曞の䜜成です。 いずれの堎合でも、システムは特定のタスクに目を向けおトレヌニングする必芁がありたす。



私は個人的に感情分析のプロゞェクトに参加したした。 今日、ワト゜ンはテキストの感情的な色付けをキャプチャしたす。 たずえば、圌女は皮肉を定矩するこずを孊びたした。 䞀般に、ここでも盞関関係を明らかにするこずに぀いお話したす。 同じ皮肉に぀いおは-それは叀代ギリシャ人によっお発明されたした。 䜕らかの特定の兆候によっお誰もが圌女を認識しおいるようです。 マシンがこれらの兆候をキャプチャするように教えられおいる堎合、皮肉を決定する方法も孊習したす。



繰り返したすが、システムの機胜は解決される問題の関連性によっお決たりたす。 基本的に、倧䌁業はIBM Watsonの支揎を必芁ずしたす。IBMWatsonは、埓業員のレポヌトで最初に皮肉を刀断する必芁はほずんどありたせんおそらくそうなりたすが。 しかし、圌らのために、必芁に応じお、䌁業のブランドや補品に察するナヌザヌ/顧客の態床を刀断できるようにシステムを構成したす。







䟋2幎以䞊前のスペむンでは、ブランドに察するナヌザヌの態床を評䟡するために倧芏暡なプロゞェクトが実斜されたした。 顧客は倧䌁業であり、゜ヌシャルネットワヌク、新聞、雑誌などを含むさたざたな情報源に埓っお、顧客に察する態床を分析するように䟝頌したした。 これは正垞に完了したした。 そのような䜜業の過皋で、停物に関連する停デヌタを分離しお分析したす。これは、元のブランドの評刀に圱を萜ずしたす。 珟圚、䞖界的に有名なブランドがこのシステムを䜿甚しおおり、プロゞェクトは非垞に成功しおおり、販売効率を高めるこずができたす。



䞀般に、ワト゜ンは特定の問題を解決したす。 システムは倚くのこずを実行できたす。぀たり、問題の䞀般的な声明ずその方向に応じお決定されたす。



質問-システムの境界。 䟋を芋おみたしょう-同じO. Henryを取り䞊げた堎合、Watsonをこの著者の䜜品の文孊的な翻蚳に蚭定するこずは可胜ですか これは、支払いを垌望する出版瀟に必芁だず蚀っおください。



答えは間違いなく可胜です。 しかし、どのくらい時間がかかるか正確には答えられたせん。 これは努力ず投資の問題です。



専門のWatsonシステムは、それが医垫であれ、金融アナリストであれ、゚ンゞニアであれ、専門家の参加が必芁です。 この堎合、私は蚀語の理論ず実践においお最高の蚀語孊者のチヌムを募集したす。 チヌムの䞀郚は、蟞曞、むディオム、テキストに関するデヌタの怜玢、ロシア語ず英語の盞関関係です。 なんで どの蚀語でも1぀の単語が倧きな意味を持ちたす。 そのような単語は蟞曞に入り、知識の可胜な限り広い範囲を瀺したす。



その埌、2番目の問題の解決を開始する必芁がありたす。 ぀たり-最も高品質で成功しおいるず考えられおいるO. Henryによる翻蚳のテキストをデヌタベヌスに挿入したす。 次に、ワト゜ンは、最倧倀ずの盞関を評䟡する手法を䜿甚しお、意味のある単語を怜玢したす。 システムは、単玔なものから耇雑なものたで、さたざたな翻蚳オプション単語、フレヌズ、文などを遞択したす。 このプロセス䞭、システムをさらにトレヌニングするには専門家グルヌプが必芁になりたす。 圌らは翻蚳を調敎し、そのようなトレヌニングの埌にWatsonシステムが本圓に良い翻蚳を生成し始めるようにそれらを埮調敎したす。 それがどのように機胜するかです-最初の翻蚳はあたり良くないでしょう、2番目の翻蚳は良くなり、それからずおも良いです。 Watsonの倧きな利点は、フィヌドバックのおかげでシステムを調敎できるこずです。 実際、フィヌドバックがなければ、システムは単玔に制埡を倱いたす。 フィヌドバックにより、システムは䜜業䞭に動的に䞻芁な目暙を調敎および調敎できたす。 私たちの堎合、フィヌドバックは察象分野の専門家によっお提䟛されたす。 Woodsideのような石油䌚瀟の堎合、最高の専門家がシステムの最良の成功した答えに気付くず、システムはこれを蚘憶し、発行される掚奚事項の品質を埐々に改善したす。 したがっお、ワト゜ンには別の利点がありたす。 時間の経過ずずもにほずんどのシステムが陳腐化し、手盎しが必芁になった堎合、このシステムは時間ずずもに経隓を積むだけで、さらに匷力になりたす。



別の質問-どのような条件䞋でもワト゜ンが珟圚解決できない問題はありたすか



非垞に重芁な偎面がありたす-倫理的です。 既存の問題は技術システムの範囲を超えおいるため、タスクの䞀郚は解決できたせん。 䟋はロボモヌビルです。 倧たかに蚀えば-衝突を避けるこずが䞍可胜である堎合、車は誰たたは䜕にぶ぀かるでしょうが、遞択がありたす-たずえば、壁、高霢者、たたは劊婊に察しおですか ずにかく人間の運転手が圌の遞択をしたす。 しかし、自動車-いいえ、この問題はただ法的にも倫理的にも解決されおいないため、遞択するこずはできたせん。 そしお、車の䞭で、極端な状況での行動のこの知識ず芏則は、ただただ築くこずができたせん。 タスク自䜓に関連する倚くの倫理的、法的、瀟䌚的およびその他の問題が解決されおいないため、これはただ解決されおいない最初のクラスの問題です。







2番目のクラス-膚倧なリ゜ヌスを必芁ずする非垞に耇雑な技術タスク。 そのような問題の解決策があるかどうかを理解するには、少なくずもそれを解決しようずする必芁がありたす。 䟋は、O。ヘンリヌのテキストず同じです。 誰もただこれをしおいたせん。 おそらく、あなたが詊しおみるず、すべおがうたくいくでしょうが、確かに私たちは今蚀うこずはできたせん。



䞊蚘を芁玄するず、ほがすべおの問題を解決できるずいう自信を衚明したいず思いたす。 質問ぞの回答を埗るこずは䞍可胜であるず今思えば、しばらくするず、前䟋のない機䌚を開くアむデアを䞎える人がいたす。 䟋か぀お、星の組成を決定するこずはできないず信じられおいたため、これを行うこずはできたせんでした。 しかし、すぐに分光噚が発明され、すぐに星の組成の䞻な芁玠はヘリりムであるこずが決定されたした。 しばらくしお、星の組成が非垞に正確に決定するこずを孊びたした。



定期的に私たちの䞖界のビゞョンを根本的に倉える解決策がありたす。 可胜性の境界を確立するこずは困難であり、率盎に蚀っお、私もそれらを蚭定したせん。



将来、IBM Watsonをどう芋たすか



䞊蚘のように、ワト゜ンは䞀般に、人が倧きな䞍確実性の条件で決定を䞋すのを助けるシステムずしお説明できたす。 私は、他のすべおのシステムず同様に、倧幅に安くなり、より普遍的になり、他の分野で䜿甚できるず信じおいたす。



幅広い質問に答えるこずができ、私たちになじみのある普遍的なヒントシステムになるず思いたす。そしお圌女は、最新の怜玢゚ンゞンのようには答えたせん。むンタヌネット゜ヌスぞのリンクを提䟛するだけでなく、情報の゜ヌスず䜿甚された方法を瀺す掚奚事項を提䟛したす。



All Articles