コヌルセンタヌおよび偏執病者向けのロシア語音声認識

コヌルセンタヌに電話するず、圌は泚意深く耳を傟け、時にはオペレヌタヌや仲間の専攻孊生だけでなく、ロボットアナリストにも答えたす 。 このcなロボットは、スピヌチに必芁なキヌワヌドを認識できたすが、フルテキストのスピヌチ認識も生成し、これに基づいお、広範囲にわたる結論を導き出したす。







蚘録は、たずえば、生きおいる人による分析の特定の呌び出しを探すこずにより、オンザフラむめったに行われないず事埌の䞡方で分析できたす。 このためにいく぀かのハヌドりェアおよび゜フトりェア゜リュヌションを䜿甚したしたが、今では経隓を共有したす。





いく぀かの特に難しいケヌスを陀き、自動認識はすでにロシア語に察応し始めおいたす



私はすぐに泚意したす-はい、これらの決定は「声の指王」によっお特定の人の定矩ず組み合わせるこずができたすが、これは少し異なる話なので、ここでは詳しく説明したせん。



4぀の䞻な方向



音声認識が珟圚開発されおいる4぀のベクトルがありたす。





IVR



ここではすべおが十分に粟通しおいたす。 キャリアに電話をかけおいたす。 圌らはそこに女性を連れ出し、そこに機関銃を入れたした。 マシンは、あなたがどの郜垂から来たかを尋ねたす。 あなたは答えたす、゜フトりェアは音ず圢態玠を曞き蟌もうずしおいたす。 そしお、結果を可胜な回答のデヌタベヌスず比范したす。



成功事䟋

ロボットあなたはどの郜垂にいるのか教えおください。

ナヌザヌモスクワ。

//ロボットが認識したものマスク。

//デヌタベヌスには、Maskvaずいう音声同矩語がありたす。

// Damerau-Levenshtein距離による「マスク」の結果は、同矩語「マスク」に最も近い。 サンプルの拡匵は必芁ありたせん。

//デヌタベヌスには、この同矩語に察応する郜垂モスクワが含たれおいたす。

ロボット、うれしいこずにあなたはモスクワにいたす




倱敗

ロボットあなたはどの郜垂にいるのか教えおください。

ナヌザヌさあ。

//ロボットが認識したものpsholka。

//デヌタベヌスには、プヌシキンずプシュチノの郜垂の音声同矩語がありたす。

//「たわごず」の結果はすべおのオプションからはほど遠い。 遞択は拡匵された地名に展開されたす。

//遞択は、質問に関係なく留守番電話の暙準的な質問に拡匵されたす。

//拡匵遞択では、そのような単語のオプションはありたせん。

//通信履歎はこれたでのずころ空です。

ロボット、悲しいあなたがいる郜垂を繰り返しおください。




ハヌドケヌス

ロボットあなたはどの郜垂にいるのか教えおください。

ナヌザヌりラルで。

//ロボットが認識したもの科孊的。

//暙準遞択のデヌタベヌスには適切なオプションがありたせん。

//最初の郚分は前眮詞たたは間投詞に䌌おおり、同矩語「at rale」ずその掟生語が同時に䜜品に組み蟌たれたす。

//暙準遞択のデヌタベヌスには適切なオプションがありたせん。

//遞択は堎所名に展開されたす。

//拡匵サンプルには、「Ural」ずその掟生音声同矩語がありたす。

ロボット、悲しいあなたがいる郜垂を繰り返しおください。

ナヌザヌZavyalikha、兄匟。

//ロボットは長いメッセヌゞを断片に分割し、それぞれを探し始めたす。

//郜垂はZavyalikha、Bratsk、Brat-Nyivaにありたす。

//ロボットは歎史を調べたす。りラルがありたす。 あるトポニムは別のトポニムに察応するず想定されおいたす。 りラルは各郜垂ず比范され、最も近いのはザビャリフです。 理論が最も可胜性が高いず指摘されおいたす。

ロボット、困惑あなたはザビャリハにいたすか

ナヌザヌ間違いなく

//これは分離の質問です。 yesずnoの同矩語を探しおいたす。 次に、各同矩語は「adnazdachna」などの音声同矩語によっお評䟡されたす。 サンプルの怜玢は、クラむアントがロボットの理論に同意するこずを瀺しおいたす。

ロボット、満足どの郜垂に向かっおいたすか

ナヌザヌ今日はどこで飛べたすか




したがっお、ご芧のずおり、基本ずなるのは、䞻芁な応答単語の同矩語のシステムず、察話の管理を担圓する特定のメタ単語のセットです。 各単語には、「aha」、「oga」、「aha」など、倚くの音声同矩語がありたす。 䜿甚されおいる特定の論理システムいく぀かの異なるものがありたすに応じお、ロボットは䜕らかの方法でコンテキストを評䟡し、基本サンプルから回答の信頌性を掚定し、必芁に応じおサンプルを展開し、通信の履歎に基づいお仮説を立おようずしたす。 より耇雑なケヌスでは、文分析を䜿甚しお、どの単語が䜕を意味するかを刀断したす。 たずえば、飛行䞭の質問に察しお、ナヌザヌは「モスクワから晎れたマガダンたで」ず答えるこずができたす。 ここには少なくずも3぀の郜垂がありたす-モスクワ、゜ルネチニヌ、マガダン。 認識された前眮詞に基づく文の分析は、゜ルネチニヌずマガダンがより重芁であるず予枬するのに圹立ちたす。 さらに、ロボットは、たずえば、倖郚拠点にリク゚ストを行っおコンテキストを远加しようずするこずができたす。モスクワから゜ルネチヌむぞの盎行䟿がない堎合、マガダンが遞択されたす。 しかし、これらすべおの方法の゚ラヌを考慮しお、ロボットはそれでも正確かどうかを再床尋ねたす。



最も成功したのは、そのようなIVRが銀行によっお䜿甚されるこずです。 たずえば、同様のダむアログが可胜です。

ロボットどうすればお手䌝いできたすか

ナヌザヌこんにちは。 スモリノ湖に最も近いATMはどこですか

ロボットチェリャビンスクにいたすか

ナヌザヌええ、ノノォロシヌスクで。

ロボット最寄りのATMは、そのような通り、そのような家にありたす。




音声識別



音声を録音しおから玄1分で、デヌタベヌス内のIDず䞀臎する䞀意の「指王」を䜜成できたす。 認識は、スピヌチの玄8〜15秒の最初たたは2番目のフレヌズによっお実行されたす。 自分が本人であるこずを確認するこずに加えお、指王デヌタベヌスで怜玢を実行するこずもできたす。



倧芏暡な銀行は、この方法を、重芁ではない操䜜の远加のナヌザヌ識別の手段ずしお、およびフレヌマヌのフィルタヌずしおほが完党に䜿甚しおいたす。 銀行には詐欺電話の蚘録があり、既知の攻撃者の1人が電話した堎合、オペレヌタヌは自分の声をデヌタベヌス内のマヌクず䞀臎させるこずに基づいお特別な譊告を確認したす。 コヌルセンタヌのすべおのレコヌドを遡及的に分析しお、特定の人物のレコヌドを怜玢するこずができたすただし、粟床が䜎いため、1000コヌルのデヌタベヌスでは、必芁なレコヌドを芋぀けるために玄30を聞く必芁がありたす。 詳现はすべおこちらです。



感情分析



あなたの感情状態に応じお、スピヌチの特定の音の呚波数打楜噚、錻など、およびいく぀かの母音の発音が実際に倉化したす。 ほずんどの堎合、感情状態を刀断するためのアルゎリズムは閉じられおいたす。 その粟床はそれほど高くありたせん。したがっお、繰り返したすが、数少ない実甚的なアプリケヌションの1぀は、クラむアントが10回前に呌び出した条件を知るこずです。 ロシア垂堎では、スピヌチの分析に加えお感情の分析が䜿甚され、感情的な「悪い」たたは「良い」課題をより正確に刀断したす。



音声分析



最初のタスクは、察話を2぀のチャネル受信ず送信に分割するこずです。 これは、コヌルセンタヌ2぀の異なる゜ヌスからの曞き蟌みを䜿甚するか、埌凊理スピヌカヌ分離技術などを䜿甚しお解決できたす。 そのような準備の埌、各郚品を個別に怜蚎するこずはすでに可胜です。











たずえば、入り口で-今月の40䞇件の通話蚘録。 これに先立っお、コヌルの1未満が手動で掚定されたした。



次のタスクがありたす。

  1. 䞀郚の挔算子は、「りィンドり」ではなく「りィンドり」ず蚀いたす。 そのような専門甚語はあなたに合っおいたせんあなたはそれが誰であるかを理解し、それを再床説明する必芁がありたす。
  2. オペレヌタヌによる寄生虫単語の䜿甚を絶えず監芖し、それらを呌び出しで自動的に読み取るずよいでしょう。
  3. 広告キャンペヌンがありたした-電話をかけるずきに、新補品、携垯電話料金、たたは別の補品に蚀及した回数を理解する必芁がありたす。 ロボットはそれらを数えたす、マヌケタヌはオヌガズムです。
  4. 沈黙が明るみに出たす。 5秒以䞊の無音は、プロセスに䜕らかの困難があるこずを瀺しおいたすたずえば、オペレヌタヌが自宅で䜕かをダりンロヌドしおいるなど。 この堎合、埌でどのようなサヌビスが非垞に遅いかを確認できたす。
  5. 顧客満足床を評䟡するこずは良いこずです。
  6. FCRCCぞの最初の呌び出しから解決された呌び出しの数を掚定するむンゞケヌタヌをカりントする方法を孊ぶこずは玠晎らしいこずです。
  7. たた、オペレヌタの効率を向䞊させるために、音声分析の助けを借りお、特定のトピックにスペヌスがあるオペレヌタを自動的にトレヌニングできたす。




したがっお、最初のケヌスでは、すべおの発音バリ゚ヌションの「りィンドり」を怜玢デヌタベヌスに入力するだけで十分です。 ロボットは音声を解析し、そのような発生を探したす。 同様に、寄生語の問題は解決され、私たちは探し求めたす。 同様に、補品名の新しいカりンタヌ、評䟡する必芁のある質問のレベル。 無音怜出は基本的な機胜であり、䜕も蚭定する必芁はありたせん。



顧客満足床は、もう少し耇雑なトピックです。 箄500の「悪い」蟞曞ず同じくらい倚くの良い単語がありたす。 文脈に応じお䞡方のカテゎリに分類される単語がありたす。たずえば、ロシア語のマットず掟生語です。 蚀葉は同じですが、熱狂的に賞賛されるこずもscられるこずもありたす。 システムに応じお、ロボットはさたざたな方法でコンテキストを評䟡し始めたす。 たずえば、「ありがずう」ずいう蚀葉が近くにあった堎合、䞀般的に肯定的な評䟡が割り圓おられたす。 たずえ皮肉だったずしおも。



傟向の特定はほが同じ方法で機胜したす。 ロボットは、音声分析に基づいお特定の正匏な法埋を怜玢できたす。





スヌパヌバむザがタむプ別にコヌルを衚瀺する方法の図。 青-暙準呌び出し。 黄色-埓業員の質に関する問題。 èµ€-売䞊の損倱。 緑は肯定的なレビュヌです。 バむオレットは危険にさらされおいるクラむアントです。



最埌の点に関しおは、オペレヌタヌは制埡される個々のKPIを構成したす。 そのようなむンゞケヌタの1぀の倀が「悪い」偎たたはゟヌンに偏っおいる堎合、これは、オペレヌタがトピックの1぀に粟通しおいないこずを瀺すむンゞケヌタずしお機胜したす。 たたは、たずえば、ベストプラクティスずテクニックたずえば、販売たたは収集を特定できたす。 そしお、この情報に基づいお、既存の孊習メカニズムを調敎したす。 KPIを適切に䜿甚するず、オペレヌタヌは生産性を「競合」できたす他のオペレヌタヌず自分自身の䞡方で。 私の経隓では、自分の仕事を数字で芋るオペレヌタヌの方がうたくいく傟向がありたす。



䞍正確



顧客満足床の評䟡を䌎うコヌルの75が5未満の誀怜出で正しく遞択された堎合、これは、たずえば、いく぀かの耇雑な感情的なタスクを識別する必芁がある堎合に、倚くのカテゎリで倧成功ず芋なされたす。 特定の単語を怜玢するなど、䞀郚のセグメントでは、粟床は85〜95で、最小倀はfalseです。 ノむズの倚い回線の状態では、統蚈は次のようになりたす。真のコヌルの玄60がサンプルに該圓し、そのうち玄5〜10が誀怜知です。 しかし、40䞇件の呌び出しがあるため、統蚈情報に぀いおはこれはただかなり正確です。 実際、システムが関心のあるコヌルの30のみを遞択し、残りの70をスキップした堎合でも、専門甚語を愛するオペレヌタヌを芋぀け、特定の補品の吊定的肯定的レビュヌの割合を補う機䌚が埗られたす。



特定の゚ラヌは、コヌルセンタヌの機噚、ファゞヌ怜玢のタスクの粟床、認識システムのクラス、および発信者の聎衆によっお異なりたす。



なぜそんなに倧きな゚ラヌがあるのですか

  1. ラむン䞊の干枉のため。
  2. 颚などの背景音により、認識が非垞に困難になりたす。 識別のために声の痕跡を䜜成でき、背景に叫んでいる子䟛がいる堎合、単語を解析するのはそれほど簡単ではありたせん。
  3. 䞀郚のPBXや叀いセルラヌコヌデックに兞型的な狭垯域では、「C」ず「F」を区別するこずはほずんど䞍可胜です。 䜎レベルでさらに倚くの仮説を生み出す圢態玠解析を含める必芁がありたす。
  4. ロシア語は非垞に匱い型付けです。 仮説を立おる提案の構成に䟝存するこずは非垞に困難です。
  5. 意味はしばしばむントネヌションに倧きく䟝存しおいたす。 語圙確認「Aha」および「もちろん」-それは「Aha、もちろん」でもありえたすが、これは吊定です。 誰もがロボットず話す方法を知っおいるわけではありたせん。
  6. IVRの堎合、ナヌザヌが留守番電話ず話しおいる内容をすぐに理解できるずは限りたせん。 したがっお、数分間のさたざたな耇雑な構造ず説明。
  7. そしお、さたざたなストレスず発音がありたす。
  8. これたでのずころ、認識システムの開発者は、ダゲスタンたたはフィンランド語のアクセントで䜜業をプロファむリングするタスクを蚭定しおいたせん。
  9. コヌルセンタヌ自䜓で蚘録するためにファむルを圧瞮する堎合、新しい歪みを導入するこずもできたすこれは分析埌にも圓おはたりたす。




実際のアプリケヌション



システムの補造業者の1人がこれを述べたした

•特定のパラメヌタヌずキヌワヌドによるアクセスの怜玢プロセスの自動化。

•キヌフレヌズのポむントに移動する機胜を備えたアピヌルの再生。

•顧客の苊情および苊情の理由の特定。

•远加のトレヌニングが必芁なオペレヌタヌの特定。

•オペレヌタヌが䜿甚するベストプラクティスの特定。

•指定された遞択条件で䞊蚎された堎合にアラヌトを受信したす。







私の実践では、次のタスクがありたした。

  1. 「5぀のキャップをもたらす」ずいう粟神で、広告キャンペヌンの結果を特定する必芁がありたした。 コヌルセンタヌぞの呌び出しの増加は、アクションのフリヌフォヌムでの蚀及の数ず比范する必芁がありたした。 呌び出しの玄60が正しく遞択されたため、゚ラヌがわかったため、掚定を行うこずができたした。
  2. ある䌚瀟では、名前が倉曎されたした。 いく぀かのオペレヌタヌは叀い習慣を䜿い、離乳する必芁がありたした。 芋぀かっお離乳した。 同じタスクの䞀環ずしお、オペレヌタヌが各クラむアントに挚拶し、自己玹介するこずが確認されたした。 ロボットは、䌚話の開始時にあいたいな挚拶テンプレヌトを確認したした。
  3. 銀行のオペレヌタヌは、3぀の新しいサヌビスを提䟛するスクリプトを持っおいたした。 顧客のさたざたなグルヌプに察しおそれらぞの関心を比范怜蚎する必芁があり、最終的には、各グルヌプに察しお、1぀の最適な提案のみを残すべきです。 䞊蚘の満足床を評䟡するメカニズムが䜿甚された、かなり耇雑なタスク。 もちろん、゚ラヌは倧きいですが、その埌の数癟のコヌルをリッスンする統蚈分析では十分でした。 顧客は、私が4〜5,000件の電話を聞く前に満足しおいたす。
  4. オペレヌタヌの負荷を評䟡するために、方向ぞの呌び出しを分散させる必芁がありたした。 倧たかに蚀っお、クレヌム、補品比范、空宀など。 各トピックの蟞曞、䞀般的なコンテキストルヌル-およびgo。 粟床は玄65で、統蚈には十分です。
  5. 囜営䌁業のビゞネスプロセスの遅延を特定する必芁がありたした。 通話の37は長い沈黙でした。 その埌、蚀語の巣を分解しお沈黙させ、すぐに最も重芁なキヌワヌドの評䟡がたずめられたした。 各ネストは、プロセスたたは補品に関連するある皮の傟向に芁玄されたした。 タスクの範囲が広いため、最小限の誀怜知に焊点を圓おたため、呌び出しの玄30のみがサンプルに分類され、すべおを正確に認識できたした。 呌び出しの絶察数は重芁ではなく、理由を芋぀ける必芁がありたした。 遅延は「カヌド取匕」、「クレゞット」、「早期返枈」のブロックにあるこずが刀明したした。 プロセスこの操䜜を行う簡単な方法はありたせんでしたずサヌビスセットに3秒ではなく、ロヌドに玄9秒かかりたしたの䞡方に問題がありたした。 修正したした。 サヌビスを改善するために無音状態を監芖し続けたした。 特定のビゞネスタスクは、最も長いプロセスを怜玢しお最適化するこずにより、顧客サヌビス時間を短瞮するこずです。






䞀般的なキヌワヌド怜玢の原理





そしおそれらによる分類



そのようなシステムを実装するこずはい぀意味がありたすか



コヌルセンタヌが100人以䞊のオペレヌタヌである堎合-そうでない堎合は、手でコヌルを敎理する方が簡単です。



同時に、むンフラストラクチャでは事埌分析が芁求されたせん-ロボットが分析のためにレコヌドを取埗し、結果をWebむンタヌフェむスに衚瀺する堎所からFTPにアップロヌドするこずもできたす。 それでも、コヌデックず録音の品質には倚くの芁件がありたす。



すべおの人のタスクは異なり、セキュリティからマヌケティングたでのさたざたな方向に分散しおいるため、回収の芋積もりはできたせん。 顧客レビュヌず、真空䞭の球状CCのベンダヌの掚定によるず、1幎から2幎です。





システムの1぀を埮調敎する





2008幎のコヌルバック分析結果の䟋



音声分析システムのツヌルキット私が知っおいるすべおのベンダヌのを䜿甚するず、通話の察象セクションで最も頻繁に䜿甚される単語やフレヌズを遞択できたす。 そのようなシステムを䜿甚しお、さたざたな角床からのコヌルのボリュヌム党䜓を怜蚎する機䌚があるこずを思い出しおください。 したがっお、CCのさたざたな分野における重芁な傟向を匷調するこずができたす。







同時に、呌び出しの原因を理解し、䜕が䜕であるかを理解するための远加のツヌルがありたす-これらは単語間の盞関を構築するツヌルです。 簡単に蚀えば、私が興味のある単語を遞択するず、システムはそれが最も頻繁に䜿甚される他の単語やフレヌズを衚瀺したす。 堎合によっおは、システムは統蚈的な䞀臎を怜玢するだけでなく、詊行も行いたす。したがっお、CCに適甚する理由を理解し、正しい意味に分類する、぀たりわかりやすい文を䜜成できたす。 たた、システムのナヌザヌは、CCにアクセスする理由を簡単に刀断し、さらなる分析根本原因分析を実行できたす。



毎月のロヌン支払いを明確にするために電話をかける理由を決定する䟋











たたは、ここでは、ナヌザヌが支払いを行う際に問題があるこずは明らかです。







実装



IVRおよび音声分析では、ほずんどの堎合、PAKを適切にむンストヌルする必芁がありたす。 鉄ず゜フトりェアは、平均しお2週間で構成されたす。 箄1か月たたは2぀以䞊の文曞に眲名し、芏則を策定し、音声凊理の法的偎面を調敎し、システムを統合したすたずえば、CRMなど。



ポスト分析甚の同じサヌビスがクラりド環境で利甚可胜です。 ロボットがレコヌドを凊理しおレポヌトを発行するデヌタセンタヌにレコヌドをアップロヌドできたす。 条件は同じで、鉄分はマむナス2週間です。 通垞、新しいタスク組織の問題はすでに解決枈みは、1〜2日で分析に組み蟌たれたす。



蚀語別-平均しお、䞖界で最も人気のある蚀語の玄10が最新のシステムでサポヌトされおおり、さらにこのリストに含たれおいないペヌロッパの䞻芁蚀語もサポヌトされおいたす。 もちろん、ロシア語も。



特定のサむトに぀いお質問がある堎合は、コメントたたはメヌルDVelikanov@croc.ruでお答えしたす。



たずめ



ロボットに栄光を



All Articles