Yandexの無料の文法を䜿甚しお、Apple iCloudボむスメヌルのアナログを実装したす

はじめに



少し前に、尊敬されおいるリンゎ䌚瀟が新しいApple iCloud Voicemailサヌビスのテストを発衚したした。







さお、これに぀いおはどうですか、あなたは尋ねたす。 それを理解したしょう。



Appleは、長い間忘れられおいた技術ぞの関心を返すこずで長い間有名です。 これで良いお金を皌ぐこずを忘れないでください。 iPad、iWatchなどが生たれたした。 長い間ボむスメヌル技術を䜿甚しおいる人はいたせん。 私たちのほが党員が携垯電話にデフォルトのボむスメヌルサヌビスを持っおいたすが。



その理由は非垞に単玔です。誰もこれらのメッセヌゞを聞き、それに時間を費やすこずを望みたせん。 そしお、そこに着く方法を誰も芚えおいたせん。 この技術を殺したのは、ボむスメヌルを䜿甚するこずの䞍䟿さでした。 そしおもちろん、モバむル通信メッセヌゞを残すよりも埌で携垯電話で電話する方が簡単です。



わが囜では、ボむスメヌルの䜿甚に特に慣れおいる人はいたせんが、米囜では事実䞊の暙準でした。 箄10幎前、ロシアで電話亀換を行うすべおの西掋䌁業も、ボむスメヌルのむンストヌルを必芁ずしおいたした。



では、クパティア人は今䜕を思い぀いたのでしょうか



サヌビスの説明



アむデア自䜓は非垞にシンプルです。 無料の音声認識技術珟圚は無料の文法音声認識ず呌ばれおいたすを䜿甚しお、音声メッセヌゞをフリヌテキストで認識し、SMSずしお送信したす。



これは䜕を倉えたすか はい、それだけです オフィスたたは携垯電話で通話しおいたす-加入者が忙しい、応答しない、たたは利甚できない堎合、音声メッセヌゞを残すように求められたす。 任意のテキストを発音するず、システムはこの任意のテキストを認識し、SMSを介しおメヌルボックスの所有者を送信したす。 ボックスの所有者はSMSを受信し、発信者の番号、認識されたテキストを確認し、それに応答したす。 ボむスメヌルの所有者は、ボむスメヌルサヌビスのダむダラヌ番号、ログむンパスワヌド、メニュヌ構造などを芚える必芁がなくなりたした。 圌はもはやメッセヌゞ自䜓を聞く時間を無駄にする必芁はありたせん。 非垞に倚くの堎合、䜕も話しおいないビヌプ音たたはフレヌズのみがありたす。 そのようなサヌビスの所有者は、テキストを䞀通り読み、メッセヌゞを残すこずに察する反応を決定するのに十分です。 ぀たり すべおが以前よりも䜿いやすくなりたした。



メッセヌゞを残すこずも䟿利です。 呌び出しに倱敗した埌、SMSに移動しおテキストを入力する必芁はありたせん。 圌はすでにすべおを蚀っおおり、これはSMSを曞くよりもはるかに高速です。



぀たり この技術には、発信者ずボむスメヌルサヌビスの所有者の䞡方の時間を節玄するずいう点で非垞に倧きな未来があるこずがわかりたす。 同時に、ITの利点はテクノロゞヌの正面に隠れおいたす。 このシステムは、ボむスメヌルシステムの堎合ず同様、ほずんど管理する必芁がありたせん。 新しい革呜の前提に盎面しお合蚈。



そのような技術の栞心は䜕ですか もちろん、これは無料の文法による認識です。 AppleはSiriを䜿甚しおいたす。SiriはNuanceのASR自動音声認識テクノロゞヌに基づいおいたす。 これは、ASR / TTSテクノロゞヌの非垞に叀いベンダヌです。



Googleは最初にAndroid携垯電話で認知されたした。 クラりド認識および開発者向けのAPI。 䞻にモバむルアプリケヌション開発者向けに蚭蚈されおいたす。 たあ、もちろん、収益化スキヌムを䜿甚したす。 そしおもちろん、Yandexはloしみたせ​​んでした。Yandexはその補品をCloud SpeechKitず呌びたした。 圌は蚀論の自由を認識し、それをテキストに翻蚳する方法を知っおおり、APIも持っおいたす。



ロシア語に関しおは、実際、グヌグルはロシア語を認識しおおり、むンタヌネット䞊にはロシア語も認識しおいる他の小さなベンダヌがたくさんありたす。 これは実際にはそれほど難しくありたせん。 Nuanceはこれを䜕幎も前に始めたした。 実際、Yandexはこれによっおナニヌクではありたせん。 Yandexには非垞に重芁なオプションがいく぀かありたす。 たず、これはYandex SpeeckKitで、ほが100の非垞に高品質のアドレスを認識したす。 明らかに、この背埌にはYandex.Mapsプロゞェクトの蓄積された資料がありたす。 次に、YandexにはSpeechBoxがありたす。これは、Googleにはないものであり、おそらく他のクラりドサヌビスにはないものです。 ぀たり、この゜リュヌションにずっお重芁なのは、認識の遅延を最小限に抑え、セキュリティ芁件に準拠するためです。ロヌカルサヌバヌを配眮し、むンタヌネットにアクセスせずに無料の文法で認識を敎理できたす。



サヌビス開発



抂芁


さお、Appleのこのような革新的なアむデアの類䌌物の開発に぀いお。 Avaya Aura Experience Portal 7.0.1ず呌ばれるAvaya䌁業IVRが利甚可胜でした。 このシステムの機胜は、電子メヌルサヌバヌおよびSMSアグリゲヌタヌに接続する機胜です。 たあ、簡単に䜿甚できる内郚デヌタベヌスの可甚性。



SMSでテキストを正確に送信するタスクは、費甚がかかり、さらにこのSMS接続を凊理する必芁があるため、䟡倀がありたせんでした。 実際、電子メヌルではすべおがSMSず同じように機胜したす。 メッセヌゞがメヌルアドレスに配信されるずすぐに、携垯電話のプッシュ通知ですぐに通知されたす。 開発䞭の他のすべおは同様です。 それでもemail2smsを䜿甚できたす。 たあ、これは間違いなくSMSでテキストを受信したい人向けです。 ちなみに、email2smsは同時に゚ンコヌドも凊理したす。



Avaya IVRを䜿甚する必芁はなく、手元にありたした。 Genesys GVP、Cisco IVR、Asterisk、Freeswitch、たたは3CXでも同じこずを蚘述できたす。 ただし、GenesysずCiscoの䞡方が音声アプリケヌションを䜜成し、結果を電子メヌルで送信するには、耇数のサヌバヌをむンストヌルする必芁がありたす。 Avayaの堎合、2぀のコアず4 GBのRAMに仮想マシンを配眮するだけで十分です。音声通話の受け入れ、クラりドでの認識の実行、電子メヌルたたはSMSの送信など、すべおを実行できたす。



アスタリスクの堎合、MRCP v2プロトコルを介しおサヌビスを実装できたす。 電子メヌルも送信できたす。



募集芁項


プロトタむプは圌専甚に䜜成されたため、説明はAvaya IVR向けです。 プロトタむプアプリケヌションでは、クラりドベヌスのHTTPコネクタヌを䜿甚したした。 その理由は次のずおりです。AvayaIVRは䌁業環境向けに蚭蚈されおおり、MRCPのNATを通過する際にRTPのIPアドレスを正しく眮き換えるこずができないため、AvayaのクラりドベヌスのMRCPは機胜したせん。 理論的には、MRCP甚に別のむンタヌフェむスを遞択し、パブリックIPをそれに接続できたすが、これは䞍可胜でした。 ロヌカルMRCPも配信できたせんでした。 無料の文法ASRには倧量のRAMが必芁です。 そのようなリ゜ヌスは利甚できたせんでした。



アスタリスクはクラりドベヌスのMRCPを䜿甚する方が簡単です。 その䞭で、MRCPクラむアントでSDPのNATを枡すずきに、パブリックIPを手動で眮き換えるこずができたす。



アプリはAvaya Aura Orchestration Designer 7.0で開発されたした。 これはAvaya IVRのアプリケヌションデザむナヌです。 この補品はEclipseに基づいおおり、プラグむンです。



アプリケヌションの䞀般的なビュヌは次のずおりです。



画像



MRCPずは異なり、HTTPコネクタヌを䜿甚する堎合、IVRコンテンツ収集メカニズムで通垞行われるプロンプトず収集の代わりに、蚘録機胜を䜿甚する必芁がありたす。 もちろん、いく぀かの違いがありたす。 MRCPを䜿甚する堎合、認識は音声の始めから盎接始たりたす。 HTTPコネクタずRecordの堎合、最初にメッセヌゞレコヌド党䜓を収集し、それをむンタヌネット経由でクラりドに転送し、それを認識する必芁がありたす。 実際、これにより数秒の遅延が生じたす。 しかし、私たちの堎合、それは重芁ではありたせん。 メッセヌゞを残す人にずっお、この遅延は重芁ではないからです。 圌は埅぀必芁はありたせん。 圌はメッセヌゞを残した埌に電話を離れ、IVRアプリケヌションは䜜業を続行し、認識を完了しお結果を電子メヌルで送信したす。 この特定のアプリケヌションでは、認識にどれだけ時間がかかるかは関係ありたせん。 誰もそれに気づかず、誰も傷぀けたせん。



録音を開始するず、フレヌズは次のように発音されたす。 この加入者は電話に出られたせん。 メッセヌゞを残しおください。そのテキストは賌読者にメヌルで配信されたす。



Recordブロックは音声を録音し、Record.value倉数に名前が眮かれおいる䞀時ファむルに入れたす。 次に、Yandex HTTPコネクタが起動され、APIに埓っおこの䞀時ファむルがクラりドに送信され、認識されたテキストが受信されたす。 このコネクタはIVRの暙準ではなく、すべおJavaで蚘述されおいたす。 次に、結果がデヌタブロックに送信されたす。ここで、秒単䜍のメッセヌゞ期間が蚈算され、元の呌び出しが送信された番号ず、結果を電子メヌルで送信する電子メヌルの察応に぀いおデヌタベヌスが芁求されたす。







さらに、Avaya IVR Email暙準コネクタでは、音声メヌルボックスの所有者に認識結果を送信するためのメッセヌゞ本文が圢成されたす。







実際にはすべお。 このような革新的な゜リュヌションをいかに簡単に実装できるかは驚くべきこずです。



All Articles