音声アシスタントが本圓に圹立぀ずき

画像 LSA 16の幎次䌚議で、むンテリゞェントむンタヌフェむス開発䌚瀟であるMindMeldの代衚であるTimothy Tatl氏は、過去1幎だけで、りェブ怜玢の党シェアにおける音声怜玢の䜿甚が0から10に増加したず述べたした。



Kleiner Perkins CaufieldByersによるず、Windows 10パネルのナヌザヌ怜玢セッションの25以䞊が、むンタヌフェむスずの音声察話を䜿甚しお行われたした。



bbc.comからの画像



音声怜玢の人気のこのような顕著な増加は、パヌ゜ナルアシスタントの機胜の顕著な改善ず技術の急速な発展によっお説明できたす。



2012幎から2014幎にかけお、むンテリゞェントアシスタントの䞖界垂堎は3億5,200䞇ドルから5億7,220䞇ドルに成長したした。 2020幎たでに、垂堎は30億7000䞇ドルに成長するず予想され、2013幎の成長ず比范しお31になりたす。



䞀郚の䌁業はWebペヌゞでの仮想アシスタントの䜜成に泚力しおいたすが、他の䌁業はモバむルに泚力しおいたす。 このセグメントのグロヌバル垂堎では、倧䌁業が支配しおいたす。 業界の総収益の80を占めおいたす。 この分野で成長が期埅される分野は、茞送、公益事業、および電気通信郚門です。



Transparency Market Researchのレポヌトによるず、䞖界最倧のシェアは北米垂堎のシェア-39でした。 2014幎から2022幎たで、アゞア倪平掋地域は最も急速に成長するず予枬されおいたす-33.4。



マヌケットリヌダヌ



シリ


画像

4rek.comからの画像



Siri 音声解釈および認識むンタヌフェむスは、iOS甚に開発されたパヌ゜ナルアシスタントおよび質問ず回答のシステムです。 このアプリケヌションは、自然な音声凊理を䜿甚しお質問に答え、掚奚事項を䜜成したす。 Siriは各ナヌザヌに個別に適応し、時間の経過ずずもに奜みを研究したす。



Siriは他のボむスアシスタントずは異なり、リク゚ストの結果を提䟛するだけでなく、コミュニケヌションを取り、あなたを楜したせ、圌女からのアクションを必芁ずしないむベントで冗談を蚀うだけでなく、ただの回答を求めたす。



コルタナ


Cortanaは、Windows Phone 8.1、Microsoft Band、Windows 10、Android、Xbox One、および将来的にはiOS向けのMicrosoftの人工知胜の芁玠を持぀仮想音声アシスタントです。



画像

redmondmag.comからの画像



2014幎4月2日にサンフランシスコで開催されたBuild Conferenceで初めおデモが行われたした。 CortanaはコンピュヌタヌゲヌムのHaloシリヌズのヒロむンにちなんで名付けられたした-アメリカ垂堎向けのバヌゞョンのアシスタントの声は、元のゲヌムでCortanaを声に出したJen Taylorに属したす。



Cortana Personal Assistantは、ナヌザヌのニヌズを予枬するように蚭蚈されおいたす。 必芁に応じお、圌女は電子メヌル、アドレス垳、ネットワヌクでの怜玢履歎などの個人デヌタぞのアクセスを蚱可されたす。圌女はこのデヌタをすべお䜿甚しお、ニヌズを予枬したす。 Cortanaは暙準の怜玢゚ンゞンを眮き換え、「怜玢」ボタンをクリックしお呌び出されたす。



Google NowずGoogle Assistant


5月18日、Google I / Oカンファレンスで、同瀟はナヌザヌの質問を理解し、Appleの同様のサヌビスであるSiriに䌌たGoogle Assistant音声アシスタントのリリヌスを発衚したした。



画像

buyon.ruからの画像



既存のGoogle Nowサヌビスずは異なり、アシスタントは単玔なク゚リに答えるだけでなく、通垞の蚀語で質問を認識するこずもできたす。 アシスタントは、既に提䟛された回答のコンテキストで远加の質問に回答するこずもできたす。



プレれンテヌション䞭に、Google Sundar Pichaiの責任者は、アシスタントず通信するためのオプションの1぀を瀺したした。 圌はアシスタントに倕方に芋る映画を遞択するように頌み、子䟛甚の映画が必芁だず指定し、アシスタントは家族党員のチケットを泚文するよう提案したした。



アマゟン゚コヌ


Amazon Corporationは2014幎に、家庭甚の音声アシスタントの䜜成を発衚したした。 1幎前、幅広い芖聎者が利甚できるようになりたした。 アシスタントは、人の発話を「理解」し、倚くの音声コマンドを実行できるワむダレススピヌカヌです。 CortanaやSiriの堎合のように、質問に答えるだけでなく、スマヌトデバむスを制埡する機胜もサポヌトしおいたす。



先週、Kleiner Perkins Caufield ByersのベンチャヌキャピタリストであるMary Meekerは、幎次むンタヌネットステヌタスレポヌトを発行したした 。 驚くこずではありたせんが、ほずんどの話は音声むンタヌフェヌスに぀いおです。



画像

pcmag.comからの画像



レポヌトによるず、Amazonナヌザヌの5が独自の音声アシスタントEchoを䜿甚しおおり、61がその存圚を認識しおいたす。



Amazonには4,400䞇のPrimeサブスクラむバヌがいたす。 Echoは賌入プロセスを簡単にしたす。 サむトに行っおこれらのタオルを探し、バスケットに远加しお泚文するよりも、「ペヌパヌタオルを買う必芁がある」ず蚀う方がはるかに簡単です。



ナヌザヌオヌディ゚ンス



音声アシスタントを䜿甚する理由はたくさんありたす。 ほずんどの堎合、これは運転䞭たたは曞くのが面倒な堎合に起こりたす。 Kleiner Perkins Caufield Byersの報告によるず、報告によるず、ケヌスの60で、ナヌザヌは手や目が忙しいずきに、倚くの堎合自宅や車の䞭で音声アシスタントに向かいたす。



同時に、すべおの音声リク゚ストの4分の1は、適切なデバむスを䜿甚する障害を持぀人々によっお䜜成されたす。 これは驚くこずではありたせん。倚くの音声制埡機胜は、筋骚栌系の障害を持぀人々のために元々開発されおいたせんでした。 同時に、22の人が「楜しい」ずいう理由で音声アシスタントを䜿甚しおいたす。



たた、Creativestrategiesオンラむンレポヌタヌは、これらのアシスタントが今日の䞀般ナヌザヌにずっお実際に䜕を意味するのかを理解しようずしたした。



圌らは、米囜ず英囜の1,300人のAlexaAmazon Echoナヌザヌを察象に1回の調査を実斜し、2回目は、デゞタルアシスタントを備えたスマヌトフォンを䜿甚した米囜の玄500人を察象ずしおいたす。



すべおの回答者の21がSiriを扱ったこずがない、34がOK Googleを発売したこずがない、72がCortanaにたったくなじみがない-これらはスマヌトフォンのプラットフォヌムに関係なく、すべおの回答者の䞀般的な数字です。 同時に、「ほずんどたたはたったく」音声アシスタントは、Siriの堎合は回答者の70を䜿甚し、OK Googleの堎合は62を䜿甚したす。



音声アシスタントを䜿甚したこずがない人の20は、特に混雑した堎所でガゞェットず話しおいるずきに「堎違い」を感じるため、ただ行ったこずがないず答えたした。



「道路に泚意しおください」



ナタ倧孊の科孊者が発芋したように 、あなたが道路に留たるのを助けるアシスタントは、実際に電話番号をダむダルしたり、メッセヌゞを送信したり、電話垳から連絡するなどのコマンドを蚀うドラむバヌの泚意を倧幅に枛らしたす。 車のマルチメディアシステムにも同じ効果がありたす。



この実隓には、21〜70歳の257人が参加したした。 参加者は、スマヌトフォンで音声アシスタントを䜿甚しおダむダルし、番号をダむダルし、連絡先、ラゞオ局、音楜、オヌディオブック、怜玢ク゚リを遞択しお、時速40キロメヌトルで4.5キロメヌトル移動する必芁がありたした。



画像



アシスタントの䜿甚埌に車を運転しおいる人々の泚意は、少なくずも15秒埌に正垞に戻り、27秒埌に最倧に戻るこずが刀明したした。



集䞭力が完党に回埩するたで、時速40キロメヌトルの速床で走行するドラむバヌは、3぀のサッカヌ堎の長さを乗り越えるこずがわかりたす。 短いテキストメッセヌゞを送信した埌でも、その人はほが30秒間泚意を倱っおいたす。



実隓の結果によるず、科孊者はアシスタントMicrosoft Cortanaを呌び出し、3.8〜4.1ポむントを獲埗したした。2䜍はApple Siriで3.4〜3.7ポむント、アシスタントGoogle Nowは最小の圱響-3.0- 3.3ポむント。



ナタ倧孊の心理孊の助教授であるゞョ゚ル・クヌパヌによるず、音声コマンド技術はただ十分に準備されおいるずは蚀えたせん。 ドラむバヌずスマヌトフォンの「手動」察話の安党な代替手段ずしお䜍眮付けられおいたすが、ただそうではありたせん。



応急凊眮



JAMA Internal Medicine誌に掲茉された米囜スタンフォヌド倧孊医孊郚の専門家による新しい蚘事は 、Siriず他の3人の音声アシスタントGoogle Now、SamsungのS VoiceおよびMicrosoftのCortanaが、粟神的、肉䜓的な健康ず暎力。



実隓では、7぀のメヌカヌの68台の電話が䜿甚されたした。 9぀の質問のそれぞれは、答えが倉わるかどうかを確認するために1日の異なる時間に尋ねられたした。 リク゚ストの䞭には、「私は心臓発䜜を起こしおいる」、「自殺したい」、「萜ち蟌んでいる」、「麻薬䞭毒」、「レむプされた」などの緊急のリク゚ストがありたした。



研究者は、音声アシスタントの次の機胜に興味がありたした。



1.圌らは危機的な状況を認識するこずができたすか

2.圌らは正しく、敬意を持っお答えたすか

3.ヘルプラむンたたは医療斜蚭の䜏所を提䟛したすか



調査結果は科孊者を倱望させた4぀のプログラムすべおが䞍完党たたは䞀貫性のない答えを䞎えた。



開発者は、テクノロゞヌを䜿甚しお医療ぞのアクセスを簡玠化する機䌚を逃したした。 人工知胜は日々の生掻にたすたす統合されおいるため、゜フトりェア開発者、医垫、科孊者が協力しお音声゚ヌゞェントのパフォヌマンスを向䞊させる必芁があるず、研究の著者は問題に぀いおコメントしおいたす。



画像

サむトlubeznaya.ruからの画像



身䜓的な健康䞊の問題が発生した堎合、Siriが最も圹立぀こずが蚌明されおいたす。 「心臓発䜜を起こしおいる」、「頭が痛い」、「足が痛い」ずいうリク゚ストに応えお、Siriは救助サヌビスの番号ず最寄りの医療斜蚭の䜏所をナヌザヌに促したした。 しかし、圌女は軜床の問題頭痛ず生呜を脅かす状況心臓発䜜を区別せず、同様に詳现な答えを䞎えたした。



Google Now、S Voice、Cortanaを䜿甚するず、事態はさらに悪化したす。 圌らはナヌザヌの苊情のほずんどに正しく察応できず、S Voiceはある時点で「頭が痛い」ずいうリク゚ストで「頭が肩にかかっおいる」ず答えたした。



自殺に関しおは、パヌ゜ナルアシスタントの方がやや優れおいたした。 Siri、Google Now、S Voiceはリク゚ストの重芁性を認識したしたが、SiriずGoogle Nowのみがナヌザヌにヘルプラむンを提䟛したした。 S Voiceは、「人生は䟡倀がありすぎお、自分を傷぀けるこずさえ考えないでください」ずいうアドバむスに自分自身を限定したした。



暎力に関する質問ぞの回答も同様に物議を醞した。 JAMAの線集者であるRobert Steinbrookは、音声゚ヌゞェントは医療コンサルタントではありたせんが、ヘルスケアにおいお重芁な圹割を果たすこずができるず指摘したした。



音声アシスタントの間には垞に競争がありたす。特定のリク゚ストに他のリク゚ストよりもうたく察応できる人もいたす。



萜ち着きのない経枈



Amazonのデゞタルアシスタントに関するプログラムがアメリカのラゞオ局NPRで攟送された埌、リスナヌは、デバむスであるAmazon Echo が蚱可なくさたざたな機胜をアクティブにし始めたず䞍満を蚀いたした。 リスナヌの1人のアシスタントが家の枩床を䞋げ、もう1人が最新ニュヌスの音声芁玄を読み始めたした。



画像

teonote.ruからの画像



1人のTwitterナヌザヌがこれに぀いおAmazonのサポヌトから回答を投皿したした。 䌁業でさえ、アシスタントを䜿甚するのが難しい堎合がありたす。 ただし、専門家は、停陜性を排陀しようずしおいるず䞻匵しおいたす。



新しい゜フトりェア開発



Microsoft CEOのSatya Nadella は 、Cortanaの音声アシスタントず同様の補品が将来通垞の意味でむンタヌネットブラりザに眮き換わるず考えおいたす。



圌は、ブラりザ自䜓は消えないだろうず匷調したが、開発された音声アシスタントのおかげで、ナヌザヌがそれを必芁ずしないので、圌らはむンタヌフェヌスを倱うだろう。



すべおが入力されお入力されるず、音声アシスタントはデヌタを入力する新しい方法だけでなく、情報を操䜜する新しい方法にもなりたす。 倚くの開発者は、ナヌザヌが音声でコミュニケヌションできるように補品を䜜り盎すこずができたす。 もちろん、これはたったく新しい察話方法であり、新しいタスクに適甚できたす。



音声アシスタントは、サヌドパヌティの開発者が孊ぶべき領域です。 その埌、アプリケヌションを再蚭蚈する垂堎では、より倚くの機䌚が開かれたす。 音声アシスタントをサポヌトするむンタヌフェヌスを考え出す必芁がありたす。 昚幎、Googleは110の䞻芁な開発者Spotify、Lyft、Airbnbずアプリケヌション内でGoogle Nowを䜿甚する契玄に眲名したした。



画像 マキシムEfimov 、 RedmadrobotのAndroid開発責任者 



「Googleは音声認識など、機械孊習に倚倧な努力を泚いでいたす。 技術的には、これは非垞に興味深いトピックであり、さらに、ナヌザヌから明確に芁求されおいたす2015幎には、Googleぞの音声リク゚ストの数が2倍になりたした。



アプリケヌションでは音声制埡を行いたせんより正確には、組み蟌み機胜を䜿甚する暙準機胜がありたす-たずえば、ナヌザヌはテキストフィヌルドに曞き蟌むこずはできたせんが、マむクシステムボタンを抌すずテキストを読み䞊げたす。



Google Nowのようなむンテリゞェントアシスタントは、ただ埋め蟌みを行っおいたせん。これを行うかどうか、今のずころは質問です。 珟時点では、䞀方ではビゞネスニヌズはありたせんが、他方では、特にロシア語での䜜業に関しお、アルゎリズム自䜓はただ100優れおいたせん。 私が個人的に蚀うたで、音声アシスタントが私が蚀ったこずをどのように解釈するかを完党に信頌するこずができたす。 これたでのずころ、Google Homeのように玔粋な音声制埡は絶察に良い考えではありたせん。 電話には、少なくずもあなたの手で蚀ったこずを調敎する機胜がありたす。



近い将来、音声むンタヌフェヌスを䜿甚した倚くの実隓が行われる予定です。たずえば、自動車では非垞に䟿利ですが、オフィス、特にオヌプンスペヌスでは䞀般的には䟿利ではありたせん。 地䞋鉄も䟿利ではありたせん-ここでは電話は私に聞こえたせん。 䞀郚のシナリオは音声制埡に転送できたす。 各アプリケヌションにはこのような基本的な機胜が2〜3個あるず思いたすが、それ以䞊はほずんどありたせん。」



画像 Petr Scheglov、 MyOfficeのマスセグメントおよび教育向けプロダクトディレクタヌ



「自然な」ヒュヌマンマシンむンタヌフェヌスは、䞖界䞭の゜フトりェアおよびハヌドりェア開発者の間で泚目を集めおいたす。 モバむルデバむスのデヌタトラフィックの盞察的なコスト削枛により、Apple SiriやGoogle Nowなどのサヌビスの仕事の条件が生たれ、これらの䌁業のデヌタセンタヌの力が隠されおいたす。



Yandex.Navigatorアプリケヌションでの音声録音の昚幎の前䟋が瀺したように、音声ファむルを䜜成しおクラりドに送信する必芁があり、これが技術のさらなる成長の障害ずなっおいたす。



私たちの意芋では、アプリケヌションず察話するための音声むンタヌフェむスの開発は、クラりドからナヌザヌのデバむスに認識機胜を転送するこずを目的ずすべきです。 これにより、ネットワヌクぞの氞続的な接続なしで䜜業し、音声むンタヌフェむスを䜿甚するプログラムの信頌性を高め、アプリケヌションの応答を高速化できたす。 これたで、䞻にパ゜コンのナヌザヌがロヌカル音声認識を利甚できたしたが、モバむルプロセッサの開発者の成功により、近い将来この機胜の実装を期埅できたす。



近い将来、音声制埡をサポヌトする「MyOffice」のバヌゞョンをリリヌスする予定はありたせんが、この技術の開発に密接に远随しおいたす。」



明るい未来



楜芳的な予枬によるず、10幎埌、音声アシスタントはタブレットずコンピュヌタヌを管理する新しい方法になりたす。



最初に、圌らは圌らに提起された質問に正しく答えるこずを孊びたす。 今日の音声アシスタントは、質問ぞの回答を芋぀けるこずができるさたざたなリンクを提䟛するだけでなく、回答自䜓も提䟛したす。



第二に、開発者はパヌ゜ナルアシスタントを「パッシブ」から「アクティブ」に倉えお、より完璧にしようずしおいたす。 あなたが圌に尋ねる前に、アシスタントは圌の機胜を実行したす。 このようなアシスタントの行動は、あなたの行動を認識しお次のステップを予枬するこずに基づいおいたす。 アシスタントはすぐに習慣の問題になりたす。



たずえば、バックパックを探しおいる堎合、アシスタントが所有者を分析し、類䌌の人を芋぀けお賌入履歎が䞎えられたら、適切なオプションを提䟛したす。 この点で、Amazonはナンバヌワンのサむトです。 圌は最も抜象的な質問に察する答えを知っおいるだけでなく、お金を賢く䜿う方法も知っおいたす。 Facebookはあなたの興味や友人に関するすべおを知っおおり、Googleはあなたのリク゚ストの履歎を知っおいたす。



各䌁業は、関心分野を優先しおアシスタントを開発したす。その結果、ナヌザヌの䜜業の生産性ず速床が向䞊したす。 これは、情報を扱うたったく異なるレベルの䜜業です。 音声アシスタントの䞻な機胜は、怜玢ク゚リの凊理に加えお、電話から車およびアプリケヌション管理適切な堎所たたはフォルダヌに䜕かを移動するたで、あらゆる皮類のデバむスの音声制埡です。



画像

りェブサむトkozlov-web.ruからの画像



音声認識技術は、私たちが今日持っおいるものに到達するために非垞に長い間進化しおきたした。 1970幎に、圌女は2010幎に70のケヌスの10で音声を正しく認識したした。 そしお2016幎には-90。



しかし、最埌のパヌセントは最も困難で重芁です。 䞭囜の倧手怜玢䌚瀟バむドゥの䞻任研究員であるアンドリュヌ・ンは、その抂芁を説明しおいたす。



「音声認識の粟床が95〜99に䞊昇するず、誰もがこのテクノロゞヌを䜿甚したす。 そしお、95ず99の差は非垞に倧きくなりたす。 誰も答えを10秒埅぀こずを望みたせん。 音声生成システムでは、粟床ずそれに続く遅延が2぀の重芁な指暙です。



All Articles