暗号化されたVoIPストリームのフレーズを認識する

Google、マサチューセッツ工科大学、ノースカロライナ大学、およびジョンズ・ホプキンス大学の研究者グループが、暗号化された可変ビットレートVoIPストリーム内のキーフレーズを認識する方法を説明するレポートの最終版を公開しました。 彼らは、平均認識精度は50%であり、一部のフレーズでは最大90%であると主張しています。



暗号化されたストリームのビットレートの分析により、認識が可能です。この場合、さまざまなサウンドがさまざまなビットレートでエンコードされます。 たとえば、母音は高ビットレートでエンコードされ、口whiやヒスノイズはノイズであり、最小ビットレートで十分です。



VBRが4つのビットレート速度を使用する場合、人間の音声はデジタル文字の「4ビット」ストリームに変わり、4文字のそれぞれが1つの音に対応します。一見すると、これはかなり単純な暗号です。 おそらく、文字の組み合わせの確率を英語の既存のすべての単語とフレーズのデータ​​ベースと比較することにより、このストリームの統計分析を行うことが理論的に可能です。 このベースは、Googleによって数年間コンパイルされ、公開されています。 しかし実際には、これは解決することはできますが、これは非常に難しい作業です。



この科学的研究では、研究者は暗号を使用せず、辞書にある「暗号」を分析しません。 それらは、ランダムな音声でフレーズを認識する基本的な能力を示すだけです。 これを行うために、彼らはボランティアのグループを取り、VBRを使用したVoIPチャンネルで同じ長さの122文を配信させました。 次に、VoIPを介して別のグループの人々によって同じ提案が行われました。システムは、平均50%のケースで122のオプションから適切なフレーズを選択しました。



この方法は実用的な目的にはほとんど使用できませんが(認識精度が低すぎるため、122文のサンプルではなく、完全な言語ベースでシステムが動作する可能性は低いと思われます)、暗号分析がどのように検出するかの素晴らしい例です一見良い暗号でさえ保護されている情報システムのリーク。



この作品は、ジャーナルACM Transactions on Information and System Security(doi:10.1145 / 1880022.1880029)の有料セクションで公開されましたが、この作品の予備バージョンは無料アクセス( PDF1PDF2とリスト付き )で見つけることができます:2008年と2009年のテーマ会議で発表されました。 この方法自体は、2008年夏にHabré 議論されまし



All Articles