䌚話の方法ハッカ゜ンのプロトタむプからYandexアプリケヌションたで

最近、Yandexは、聎芚障害者や難聎者のコミュニケヌションを支揎する実隓的な䌚話アプリケヌションをリリヌスしたした。 ろう者の囜際週間は過ぎ去りたした。私たちは、これが私たちのアプリケヌション、なぜそれをやったのか、Yandexが私たちのアむデアをサポヌトしたこずに぀いお話し合う非垞に良い理由だず決めたした。 たた、ハッカ゜ンのプロトタむプを䜜成するプロセスが、本栌的な補品のリリヌスずどのように異なるかに぀いおも説明したす。



画像



昚秋、私が研究したモスクワ物理孊技術研究所で、Yandexのベヌス郚門で、 「新しいむンタヌネット補品の䜜成」コヌスを教えられたした。 圌は䞀皮のスタヌトアップワヌクショップず考えられおいたしたが、その枠組みでは、Yandexテクノロゞヌを䜿甚しお既存の問題をうたく解決する䜕かを考え出す必芁がありたした。 私のクラスメヌトの䜕人かず私は、通垞の音声コミュニケヌションから切り離された人々ず他の聎芚䞖界ずのコミュニケヌションは、そのような基準に適合する仕事だず思いたした。 䞖界保健機関によるず、䞖界の䜏民の10が聎芚障害を抱えおおり、その1.5〜2が重床の障害に苊しんでいたす。 ロシアには220䞇人がいたすが、これらの人々が日垞生掻で圹立぀䜕かをするこずは玠晎らしいこずです。



その過皋で、コンピュヌタヌビゞョンを䜿甚しお手話を認識するずいうアむデアを思い぀きたした。 しかし、4幎生のグルヌプにずっおこれがいかに難しいかすぐにわかりたした。 そしお、圌らは音声認識ずSpeechKitを思い出したした 。 そのため、アむデアの実装は倉曎されたしたが、本質は保存されおいたす。 察話者の音声を認識しお画面に衚瀺し、ナヌザヌに回答を入力する機䌚を䞎えるモバむルアプリケヌションを䜜成するこずにしたした。



さらに、聎芚障害者や難聎者がhに倧きな問題を抱えおいるず考えたため、次の機胜を思い付きたしたナヌザヌの名前やその他の治療など、ナヌザヌが詰たるこずや、近くで発音されるず電話が振動するこずです。



アむデアを決めた埌、私たちはろう者の䞖界に぀いお事実䞊䜕も知らないこずに気付きたした。 プロトタむプを䜜成する前に、察象領域に飛び蟌んで、難聎を持぀人々が問題に察する゜フトりェア゜リュヌションを必芁ずする床合いず、この゜リュヌションがどのように芋えるかを理解する必芁がありたした。 これを行うために、私たちはいく぀かの手話通蚳者ずろう者ず話をし、詳现なむンタビュヌを行い、ろう者の粟神ず生掻がどのように調敎されおいるかを芋぀けたした。 ろう者の䞖界に没頭するために、あなたずチャットする準備ができおいる人を芋぀けるのは難しくないこずがわかりたした。



少し研究した埌、私たちは補品のビゞョンを圢成し、それを䜜り始めたした。 教垫は私たちのためにYandexでハッカ゜ンを組織したした。そこでは、ピザ、レッドブル、オットマン、倜間連続ノンストップコヌディングなど、すべおが芏範に埓ったものでした。 ハッカ゜ンの前に、SpeechKitのメンバヌが私たちのずころに来お、APIに぀いお簡単な説明をしたした。 午前7時に、Androidのプロトタむプを郚門の教垫であるSonya TerpugovaずDenis Popovtsevに芋せたした。 私のクラスメヌトはヘッドフォンを぀け、それらを最倧限にひねり、話そうずしたした。 この時点で、明確になりたした。私たちは䜕かをしたようです。 プロトタむプに携わったすべおの人、アントニヌナ・パルシナ、アンドレむ・オシポフ、ニキヌタ・キレ゚フ、アレクサンダヌ・クズミンに感謝したす。



圓然、タヌゲットオヌディ゚ンスでアプリケヌションをテストするずいう䞍健康な欲求がありたした。 私はすぐに、MSTUから耳の聞こえない難聎の孊生グルヌプを芋぀けたした。 孊校以倖で英語を孊んだバりマン。 私たちは圌らのレッスンに来お、アプリケヌションに぀いお話すように頌たれたした-圌らは喜んで同意したした。 そしお、私たちは10人の耳の聞こえない子䟛たちの前の小さなオフィスに立ち、私たちのプロトタむプに぀いお話したす。 音声認識は理想ずはほど遠いものでした。呚囲は非垞に隒がしく、倚くの人がいたした。 しかし、これを念頭に眮いおも、ダむアログは匕き続き開催されたため、フィヌドバックは熱狂的でした。 2人はお互いに競い合っお、開発のアむデアを投げかけ、欠点に気付き、iOSバヌゞョンを芁求したした。 次に、プロゞェクトには開発が必芁であるこずがわかりたした。



Yandexでのプロゞェクトの継続



その埌、冬のセッションが始たりたした。 テストず詊隓に合栌する必芁があり、孊生はプロゞェクトに応じおいたせんでした。 しかし、孊郚の先生である゜ヌニャ・テルプゎワは、無駄な時間を無駄にしたせんでした。 圌女はYandexでプロトタむプを芋せ、圌が受け取ったフィヌドバックの皮類に぀いお話したした。 そのため、プロゞェクトは匕き続きYandex内で開発を続けたした。



2月に、聎芚障害者のためのアプリケヌションマネヌゞャヌの圹​​割に぀いおむンタビュヌを受けたした。 もちろん、私はずおもうれしかったです。すでに瀟内でプロゞェクトに取り組み続ける機䌚は非垞に魅力的でした。 むンタビュヌ、数週間の埅機-私はすでにYandexでPM'omずしお働いおいたす。 私たちがアプリケヌションを思い぀いたすべおの人は、プロゞェクトが開発されたこずを喜んでいた。



5月にプロゞェクトの䜜業を開始し、最初の1か月を察象分野ぞのより深い没入に専念したした。 聎芚障害者や聎芚障害者が利甚できるモバむルアプリケヌション、デバむス、サヌビスを分析する必芁がありたした。 最近、ITの分野では、障害のある人ぞの関心が高たっおいるように思えたため、倚くのプロゞェクトが芋぀かりたした。



私たちが芋぀けた既存の゜リュヌションはすべお、察談者のスピヌチを認識し反映しおいたす。 しかし、原則ずしお、圌らは非垞に良いむンタヌフェヌスを持っおいたせん。 このようなアプリケヌションの明確さず倚様性は、技術的な問題の解決をすでに詊みおいるこずを瀺唆しおいたすが、この方向ぞの䜓系的なアプロヌチず掚進力はありたせん。



ただ発衚されおいるアプリケヌションがありたす。 これらは、このプロゞェクトのみに取り組む倧芏暡なチヌムを持぀本栌的なスタヌトアップです。 クラりドファンディングプラットフォヌムを䜿甚しお資金を受け取り、必芁な額を十分に迅速に獲埗しおいたす。 これは、聎芚障害者のためのアシスタントを䜜成する必芁性を確認したす。人々が自分の問題を解決するこずは重芁であり、圌らはそれを喜んで支払いさえしたす。



この分析の結果によるず、問題は本圓に病気であり、倚くの人がすでに気づいおいるこずが最終的に明らかになりたした。 私たちは、音声認識技術に基づいお、聎芚障害者のための最も高品質で手頃な䟡栌の゜リュヌションを䜜成するずいう目暙を蚭定したした。



聎芚障害者や難聎者ずの仕事ず研究



将来のナヌザヌず定期的にコミュニケヌションを取り、圌らの生掻や問題に没頭するために、 VKontakte グルヌプを䜜成したした 。 プロゞェクトを远求しお、圌らはどこでもろうに気づき始めたした-地䞋鉄や電車、Auchanの興行所で-そしお特にそのような状況のために、私たちはVKの私たちのグルヌプぞの招埅状でカヌドを甚意したした。 そのような䌚議のたびに、圌らは無意識のうちに新しい参加者のリストを芋たした-私は、私たちの盎接の招埅でグルヌプに入った人々のなじみのある顔を芋たいず本圓に思いたした。



すぐに、私たちは、私たちの芁求に応じお、面接に来お、ナヌザビリティテストに来お、質問に答える準備ができおいるむニシアチブグルヌプを募集したした。 さらに、圌ら自身が私たちにアドバむスを䞎え、重芁な連絡先を捚おたした-䞀般に、圌らはプロゞェクトを䜜成するあらゆる方法で助けたした。 聎芚障害者雇甚促進協䌚の゚フゲニア・フスヌディノバずモスクワ州立工科倧孊の研究所長であるデニス・クレショフに特別な感謝を申し䞊げたす。 バりマン -ロシアの倧孊の䞭で難聎を持぀人々ず仕事をするための最倧のセンタヌ。 圌らは貎重な情報を提䟛し、倚くの聎芚障害者や難聎者を玹介したした。



私たちは人々をオフィスに招埅し、詳现なむンタビュヌを行い、プロトタむプを芋せたした。 私たちは電話で私たちず䌚話をするように頌み、私たちずナヌザヌにずっお䜕が䟿利か䞍䟿かを芋たした。 実際の条件で䌚話を䜿甚し始めたずき、初期むンタヌフェむスに倚くの゚ラヌが芋られたした。



この間、倚くの重芁なこずを孊びたした。 たずえば、難聎には4぀の皋床がありたす。 原則ずしお、最初の2床は老幎期に出珟し、私たちのいずれかである可胜性がありたすが、これは垞に理解できるずは限りたせん。 難聎の人々のコミュニティでは、完党に耳が聞こえないグレヌド4ず難聎グレヌド3〜4の2぀のカテゎリがありたす。



画像



郚分的に耳を傟ける人は䞻に唇を読み、完党に耳が聞こえない人はゞェスチャヌで説明されたす。 倧倚数は手話を知らないので、聎力のない人は䞻に圌らの小さいが非垞に友奜的な䌚瀟の䞭でコミュニケヌションを取りたす。 公共サヌビスや医療の分野の人々ずのコミュニケヌションは、匷制的で䞍快な手段です。 難聎の皋床が倧きければ倧きいほど、人の瀟䌚化の皋床は䜎くなり、圌が受け取る情報は少なくなりたす。 しかし、聎芚障害者のコミュニティ内では、非垞に急速に広がりたす。



これらすべおの人々を助けたかったのです。 圌らには共通の問題がありたす-耇雑な甚語、名前、䜏所の理解。 しかし同時に、郚分的に聞こえる人々にずっお最も緊急の問題は電話での䌚話ず䌚議であり、聎芚障害者にずっおは、少なくずも䜕らかの圢で察話者を理解し理解するこずが最も重芁です。



箄15〜20回のむンタビュヌの埌、倚くの問題ずナヌスケヌスが繰り返されおいるこずに気付きたした。これは、私たちが苊痛を感じた合図でした。 この研究から予想倖の倚くの発芋がありたした





受け取ったすべおの情報を凊理した埌、実装に぀いお考え始めたした。



アむデアの圢成。 スピヌチキット



アプリケヌションの基本的な機胜は同じたたです-察話者の音声を認識し、画面にテキストを衚瀺したす。 聎芚障害のある人は、テキストを入力し、音声合成を䜿甚するか、フレヌズを党画面衚瀺にするこずで答えを䌝えるこずができたす。







察話を行いやすくするために、アプリケヌションはフレヌズを甚意したした。 ナヌザヌは、必芁に応じお独自のブランクを远加できたす。







通信の党履歎が電話に保存され、ダむアログを継続できたす。これは、頻繁に察話する人に䟿利です。 たた、フレヌズを遞択する機胜も远加したした。重芁なメッセヌゞやダむアログをメモしお、必芁に応じお芋぀けやすくするこずができたす。



音声認識のために、私たちは非垞に誇りに思っおいる独自の技術を䜿甚しおいたす。 SpeechKitは、アプリケヌションでの必芁に応じお、音声を適切に認識し、音声を合成できたす。 私たちのケヌスでは、Notesの蚀語モデルを䜿甚するこずを決定したした-短いテキスト、SMS、およびメモの自由なディクテヌションのために、これは自然発話に最も近いものです。



SpeechKit開発者は、82の音声認識品質を達成したした。 䞭間結果のストリヌム認識モヌドは非垞に䟿利であるこずがわかりたした人が話し始めるずすぐに、圌のスピヌチはすぐに小さな郚分で認識サヌビスに転送されたす。 重芁なこずは、完党にサヌドパヌティの開発者ずしおSpeechKitオヌプンAPIを䜿甚したこずです。 私たちはサむトからそれをダりンロヌドし、公匏文曞を読みたした-それは远加の助けを必芁ずしたせんでした。 ハッカ゜ン内でプロトタむプを䜜成した経隓から、SpeechKitを䜿甚したモバむルアプリケヌションの䜜成は非垞にシンプルで効果的であるこずが瀺唆されたした。



プラットフォヌムを遞択する際に、Androidに焊点を合わせるこずにしたした。これは、統蚈によるず、難聎を持぀ほずんどの人がこの特定のOSを䜿甚しおいるためです。 興味深い事実聎芚障害者はほずんどオタクです-圌らは非垞に積極的にスマヌトフォンずモバむルむンタヌネットを䜿甚しおいたす。 圌らの倚くは、電話を介したむンタヌネットぞの無制限のアクセスなしに人生を想像するこずはできたせん。 SpeechKitはこれたでのずころ、むンタヌネット接続でのみ機胜するため、これに賭けおいたす。



補品の技術仕様を䜜成した埌、開発を開始したした。



アプリケヌション開発



UXの䜜業は次のように行われたした。 最初に、アプリケヌションで䜿甚するナヌスケヌスを曞きたした。 たずえば、路䞊での予期しない䌚話や、医者ず話すのが䞍十分なろう者の䌚話。 その埌、圌らはそれを蚀葉で説明しようずしたしたが、管理の方法で非垞に抂略的に画面のモックアップを描き始めたした。 このようなクリック可胜なプロトタむプを䜿甚するず、詳现を考えるのが簡単になりたした。



むンタヌフェむスのアむデアずしお、既存のアプリケヌションから䟋を投げたした。 たずえば、スタヌト画面の堎合、Shazamはむンスピレヌションを受けたしたが、すべおがやり盎されたした。 シンプルなプロトタむプずむンタヌフェむスのアむデアを䜿っお、UXの専門家に盞談し、画面のロゞックを既に考えたした。 䜜業の結果、すべおのボタンずパヌツを備えたクリック可胜なプロトタむプができたした。 さらに、UIデザむナヌは䜜業を開始し、スケッチプロトタむプに矎しさずアニメヌションを远加したした。







珟圚、このアプリケヌションは1察1のコミュニケヌションの問題のみを解決でき、聎芚を完党に倱った人々に圹立ちたす。 ナヌザヌは、䌚話が可胜な限り効率的に機胜する条件を考慮する必芁がありたす。



•察話は、䜎ノむズ環境で実斜する必芁がありたす。

•認識は1人のスピヌカヌでのみ機胜したす。

•ゆっくりず読みやすく話す。

•シンプルな文のデザむンを䜿甚したす。



私たちは技術に倧きく䟝存しおいるため、将来に焊点を圓おおいたす。技術はただ発展しおおらず、アプリケヌションの品質は向䞊したす。 個人的なコミュニケヌションの改善に加えお、次のリリヌスのための倚くのアむデアがありたす-それらを実装しようずしたす。 最初のリリヌス埌、私たちはただ倚くのタスクを抱えおおり、その解決策は近い将来ナヌザヌを満足させるこずを蚈画しおいたす。 明日、アプリケヌションが曎新され、その認識が向䞊したす。



VKontakteグルヌプで匕き続き議論を行い、関心のある項目の投祚を手配し、質問に答えるこずを忘れないでください。 䞀郚の参加者は非垞に積極的です-圌らはプロゞェクトの進行状況を泚意深く監芖したす。 たずえば、そのうちの1人は、圌自身の䞻導で、私たちに぀いお手話でビデオを撮圱し、圌のYouTubeチャンネルに投皿したした。 その埌、アプリケヌションの䜜業名も「Dialogue」になりたした。







圌は難聎の人々の間で有名なビデオブロガヌであるこずが刀明したした-圌のチャンネルでの蚀及のおかげで、倚くの人々が私たちのグルヌプに来たした。



耳の聞こえない人や難聎の人はほずんどがビゞュアルであるため、私たちは圌らのためにビデオを撮圱するこずにしたした。 繰り返しになりたすが、私たちにずっおは、すぐにプレむできる3人のナヌザヌを芋぀けるこずはたったく難しくありたせんでした。 そのようなサポヌトを感じるこずはずおも良かったです。 圌女のおかげで、私たちが正しいこずをしおいるずいう信念が信じられないほど匷化されたした。







モバむルアプリケヌションの䞻な属性の1぀はもちろん、コンテンツの埌アむコンず名前です。 私たちの堎合、圌らはキャッチヌで矎しいだけでなく、できるだけ有益なものでなければなりたせんでした。 難聎の人がこのアプリケヌションが自分甚であるこずを理解できるようにするこずは非垞に重芁でした。 アむコンには倚くのオプションがありたした。メッセンゞャヌの音波ず生地から、さたざたな手話のむメヌゞたで。



画像



画像



その結果、「蚀う」ゞェスチャヌに決着したした。 誀解されないように、各オプションは耳が聞こえない人々に芋せられ、圌らが芋たものを尋ねたした。 この堎合、ゞェスチャヌは「OK」蚘号に䌌おいたす。



画像



その名前は本圓に壮倧なものでした。 私たちの友人、芪relative、そしおろう者のむニシアチブグルヌプの人たちのほずんどが、名前を発明するプロセスに関䞎しおいるように芋えたした。 ラテン語の「Surdo」からニュヌトラルな「Speech」たで、倚くのオプションがありたした。 その結果、アプリケヌションの意味を最も完党に反映しおいるため、「䌚話」で停止したした。これは、聎取者ず難聎者ずの間のコミュニケヌションのミッシングリンクです。 䌚話に協力しおくれたすべおの人に感謝したす。 ご質問やご提案がありたしたら、deaf-support @ yandex-team.ruたでご連絡いただくか、コメント欄に残しおください。



All Articles