あなたが時々コールするコールセンターに音声インプリント作成システムがあれば、 彼らはあなたを簡単に識別できます 。 そのようなシステムがまだない場合は、以前に作成したレコードをワンクリックで指紋を作成できます。
これは次のように機能します。たとえば、音声でクライアントを判別するシステムがある銀行に電話をかけるたびに、会話が記録されます。 オペレーターとの会話の1〜2分で、音声のかなり正確なプロファイルを作成できます。 将来的には、最初のフレーズによって決定されます。
音声指紋を作成して確認するプロセスは非対称です。 作成には、検証のためにより多くのデータが使用され(長い通話時間)、約1桁少なくなります。 ノイズの多い行で確認した最大時間は、チェックするのに15秒です。
音声指紋とは何ですか?
音声指紋は、指紋のような、人に固有の一種の記録です。 それはその人のスピーチ自体(特定の単語または特定のフレーズ)に結び付けられていませんが、全体としての声の特徴です。 声紋を作成するための技術は閉じられていますが、非常に簡単に言えば、音声間の基準点の分析、たとえば、音声間の遷移の特性について話すことができます。
このシステムは、さまざまな身体的特徴に反応します。特定の人の会話の高さと速度に加えて、彼の音の経路、喉、咽頭、さらには鼻の生理学的特徴も考慮されます。 合計で、アクセント付きの音、発音機能、発話速度、単語や音の発音の種類、声の身体的特徴など、約50の指標が考慮されます。
そのような指紋はどのように使用されますか?
それで、あなたは1分以上話しました(あなたのスピーチの時間だけが考慮されます)。 これで音声指紋を取得できます。
今、あなたが呼び出している会社が潜在的な詐欺師の声紋(または特別な管理下にある他の人々のリスト)を持っていると想像してみましょう。 スピーチの約10秒で、最大1000レコードのデータベースとの比較が行われます。そのようなデータベースで既に点灯している場合、オペレーターはアラートを受け取ります。 さらに、たとえばセキュリティ部門など、他の通知も機能します。
2番目のケースは、今すぐ電話をかけたクライアントが実際に自分のアカウントにアクセスしたいクライアントであることを検証する場合です。 つまり、銀行に行って何らかの操作をしたり、重要な情報を取得したい場合、アカウント番号に加えて、パスワード、犬の名前、祖母が最初の結婚式を祝った村などを尋ねます。
ここでの問題は、ソーシャルネットワークで利用可能な情報がたくさんあることです。 したがって、詐欺師がアカウントにアクセスしたい場合、この情報を収集するために多大な労力を費やし、時には成功することもあります。 おそらく、彼らはあなたのVkontakteページを読んで、一度にすべての必要な情報を収集するでしょう。 時々彼らはコンタクトセンターに99回電話し、「ブルートフォース」を試みます。 この攻撃をかなりゆっくり使用すると、数か月後に成功する可能性があります。 そして、ここで実際のクライアントの痕跡が役立ちます(クライアントが正しく検証された会話で作成されます)。
その結果、クライアントが「こんにちは、私はアカウントに転送したい、たとえば、そのようなアカウント番号を持っている」と電話して言ったとき、システムは検証を実行します。
どのようにテストされましたか?
声紋の作成は閉じたアルゴリズムであるため、正確性について論理的な疑問が生じます。 テストについてお話しできます。 そもそも、コンタクトセンターとの人の会話と並行して、「彼を信じないでください」と他のゴミを叫んだだけです。 この場合、スキャン時間はわずかに増加します-指紋は数秒長く作成されます。 外に強風があると、システムにも時間がかかります。
また、電話の受話器から、複数の人が同時に話す部屋の一般的なコミュニケーションに切り替えました。同時に、実際にオペレータと話している人は、パイプの最も近くに座っています。 そして、この場合でも、システムはそれを決定しました。
クライアントまたは状況ごとに、異なるレベルの検証しきい値を設定できます。 たとえば、システムが「80%確実」である場合-これはモバイルオペレーターに残高を要求するのに適したオプションであり、「100%確実」である場合-これは秘密の単語について質問する前に銀行に適したオプションです。
コンタクトセンターの技術環境は音声検証システムに影響を与えます。個々のインストールごとに誤検知のしきい値を調整する必要があります。 はい、時々、1つのクライアントで複数のプリントが必要になる場合があります。 たとえば、クライアントが海外の携帯電話から電話をかけ、そこで録音の品質が悪いと、チャンネル自体の品質が低くなります。 いくつかのプロファイルはクライアントのアカウントに関連付けられています。システムは、各プロファイルが状況に適しているかどうかをチェックします。
回線のノイズの影響をある程度受ける音声インプリントの作成。 環境が印刷で最初の呼び出しが行われた場所に可能な限り近い場合、システムは約100%の精度を提供します。 大雑把に言えば、ノイズの多い回線での呼び出しでは、80%の精度しか得られません。
こんにちは妄想!
はい、あなたは正しく理解しました。 「Betman」のように、音声指紋を作成して会話を見つけることができます。 確かに、これはあまり現実的ではありません-大きなサンプルでは多くの誤検知があります。 したがって、これまでのところ、指紋の使用の主なプロファイルは、重要でないデータにアクセスするための詐欺ベースまたはクライアント認証との正確な比較です。 もちろん、100%動作しなかった(つまり、最初の呼び出しと同じ技術条件で実行されなかった)音声識別を唯一のセキュリティしきい値として使用することはできませんが、多くの場合、コンタクトセンターで非常に便利です。
そのようなシステムを実装する技術的特徴の詳細が必要な場合は、AleEfimov @ croc.ruに連絡してください。