モバイルネットワークを介した音声配信:ステップ2-アナログからデジタルへの変換

一連の記事の最初の部分では、人間の声の電気信号への変換について検討しました。 今、この信号を対話者の場所に送信して会話を開始する時が来たように思えます! それはまさに彼らが最初にやったことです。 ただし、このサービスが一般的になり、信号を送信する時間が長くなるほど、アナログ信号がこれに適さないことが明らかになりました。

品質を損なうことなく、あらゆる距離で情報を確実に送信するには、アナログ信号からデジタル信号への2回目の変換を実行する必要があります。







この図は、アナログデジタル変換(ADC)の間に何が起こるかを最も視覚的に表現したものです。次に、これが必要な理由、テクノロジの開発が行われた方法、モバイルネットワークでそのような変換に課される要件を検討します。





前半で説明したことを見逃した、または忘れた人は、 どのように音の振動から電気信号を取得したかを思い出すことができます。そして、私たちは今、私たちにとって新しい関心のある領域を示す変換の説明を続けます:







最初に、特別な知識と数学的変換なしでは聞こえないゼロと1のシーケンスでアナログ信号を変換する必要がある理由を理解しましょう。



マイクの後には、スピーカーを使用して簡単に「声を出す」ことができるアナログ電気信号があります。実際には、電話での最初の実験で実行されました。逆変換「電気信号-音波」は同じ部屋で、または最短距離で実行されました。

そのような電話は何のためですか? 音声情報を変更することなく、隣の部屋に音声情報を持ち込むことができます。声を上げるだけです。 したがって、タスクが表示されます-会話の開始者から最大距離で対話者を聞く。

そして、ここで容赦ない自然の法則が発効します。距離が大きくなるほど、ワイヤの電気信号はより強く減衰し、一定のメートル/キロメートルを過ぎると、そこから音を回復することは不可能になります。

10段階の自動電話交換(アナログ電話交換)で動作する都市の固定電話を見つけた人は、これらのデバイスの助けを借りて音声品質が提供されることを完全に覚えています。 そして、誰かがそのような忘れられたエキゾチックな包含物を「ブロッカー」/「パラレル電話」で思い出すことができます。同じ家の2台の電話が1本の電話回線に接続されたとき。 私を信じて-それは簡単ではありませんでした!



つまり、アナログ回線を使用して2つのポイント間の同時呼び出しの数を増やすには、より多くのワイヤを敷設する必要があります。 これがもたらすものは、前世紀の初めの都市景観から推定することができます。







したがって、電話の発明直後に、最高のエンジニアが問題の解決策を取りました。つまり、最高品質の保存と最小限の機器コストで長距離で音声を送信する方法です。



連続したアナログ電気信号が離散的なエンコードされたゼロと1のシーケンスになり、同時に情報を可能な限りオリジナルに送信するために必要なものは何ですか?



ちょっとした理論。



アナログ信号をデジタルに変換するには、一定の間隔で一定の精度で信号振幅を固定する必要があります(量子化ステップ)(下図のサンプリングステップ)。







デジタル化の後、図に示すような段階的なグラフが得られます。 デジタル化された信号のアナログへの近似を最大化するには、サンプリングステップと量子化ステップをできるだけ小さく選択する必要があります。無限値では、完全にデジタル化されたレコードが得られます。



実際には、無限のデジタル化の精度は必要ありません。必要な品質で音声を送信するのに十分と考えられる精度を選択する必要がありますか?

ここでは、人間の聴覚器官の感度に関する知識が私たちの助けになります。一般に、人は20 Hzから22,000 Hzの周波数の音を区別できると考えられています。 これらは、サンプリングの境界値であり、人が知覚した音を送信します。 Hzをより身近な秒に変換すると、0.000045秒になります。つまり、4.5万分の1秒ごとに測定を行う必要があります。 さらに-そして、これは十分ではありません。 以下に、サンプリング周波数の理由と必要な値について説明します。



次に、量子化ステップを決定します。量子化ステップにより、各瞬間に特定の振幅値を測定信号に割り当てることができます。

最初の近似では、信号の有無を確認するだけで、このような多数のオプションを記述することができます。0と1の2つの値のみが必要です。コンピューターサイエンスでは、これは情報量に対応します:1ビットと録音ビットレートは1です。このようなビットでサウンドをデジタル化する場合、出力では、一時停止と1つのトーンの音で構成される断続的な録音を取得しますが、ほとんど音声録音とは言えません。

したがって、測定される振幅オプションの数を、たとえば4(つまり、最大2ビット-2の2乗)に増やす必要があります:0-0.25mA-0.5mA-0.75mA。

このような値を使用すると、デジタル化後の音の変化だけでなく、音の有無を区別することがすでに可能になります。 この図は、サウンドをデジタル化するときにビットレート(量子化)の増加をもたらすものを完全に示しています。







これで、音楽ファイルのプロパティに44 kHz / 16ビットの数値が表示されている場合、アナログデジタル変換が1/44 kHz = 0.000023秒のサンプリングと量子化深度2から16度-65.536値オプションで実行されたことをすぐに理解できます。



ADC-DAC変換を実行するための最初の回路ソリューションは、いつものように大きくて低速でした。







現在、これらのタスクは携帯電話のメインプロセッサで実行され、同時に多数の他のタスクに対応しています。







結果のデジタルモデルをさらに最適化せずにデジタル化すると、取得されるデータの量は非常に多くなります。ディスク上のどのくらいのスペースが非圧縮形式のオーディオファイルを取得できるかを覚えておいてください。 たとえば、標準CDは780メガバイトの情報とわずか74分の音声です!

データ損失のある最適化および圧縮アルゴリズム(mp3など)を使用してこのようなファイルを処理した後、ファイルサイズを10倍以上減らすことができます。



私たちの目的にとって、受信したデータの量は基本的に重要です。なぜなら、それはまだあなたの対話者に送信される必要があり、トランスポートチャネルのリソースは非常に限られているからです。

繰り返しますが、エンジニアのタスクは、必要な品質を維持しながら、転送されるデータの量を最大化することです。



電話での会話中に聞こえる口語的な発話では、周波数スペクトルは知覚に利用できる周波数よりもはるかに低いため、電話での会話を送信する場合は、50..7000Hzなどの狭いスペクトルに制限できます。 これについては、 モバイルネットワークの音声コーデックに関する資料で詳細に説明しました



これで、変換を開始するための初期データが得られました-50-7000Hzのスペクトルの電気アナログ信号であり、A-CPUを変換する必要があります。これにより、変換中の信号の歪み(上のグラフのステップ)が録音品質に影響を与えません。 これを行うには、既存のアナログ信号の完全な説明に十分なサンプリングステップと量子化ステップの値を選択します。

ここで、デジタル信号処理の分野における基本的な定理の1つが、 コテルニコフの定理です。

その中で、同胞は、正確な数値表現のために関数の値を測定する必要がある頻度を数学的に証明しました。 私たちにとって、この定理の最も重要な結果は次のとおりです。測定は最高周波数の2倍の頻度で実行する必要があり、デジタル形式に変換する必要があります。

したがって、会話をデジタル化するためのサンプリング手順は14 kHzのレベルで十分であり、音楽の高品質デジタル化(2 x 22 kHz)では、標準の44 kHzを取得します。これにより、原則として、音楽ファイルが作成されます。



有線および無線ネットワークで使用できる多種多様な音声コーデックがあり、有線ネットワークのコーデックは一般に、音声をより良い品質でエンコードし、無線ネットワーク(モバイルオペレーターのネットワーク)のコーデックはやや品質が劣ります。

ただし、これらのコーデックは、複雑な無線条件により配信が失敗した場合に受信信号を復元するための追加データを生成します。 この機能はノイズ耐性と呼ばれ、モバイルネットワーク用のコーデックの開発は、ノイズ耐性を高めながら送信信号の品質を改善する方向にあります。



モバイルネットワークでは、加入者の現在の位置とこの時点での無線カバレッジの品質に応じて、動的に選択されたコーディングレートのセットを含む音声コーデックのクラス全体が使用されます。



コーデック 標準 創作年 圧縮可能な周波数の範囲 作成されたビットレート
フルレート-FR GSM 06.10 1990 200-3400 Hz FR 13 kビット/秒
ハーフレート-HR GSM 06.20 1990 200-3400 Hz HR 5.6 kbit / s
エンハンストフルレート-EFR GSM 06.60 1995 200-3400 Hz FR 12.2 kビット/秒
適応型マルチレート-AMR 3GPP TS 26.071 1999 200-3400 Hz FR 12.20
適応型マルチレート-AMR 3GPP TS 26.071 1999 200-3400 Hz FR 10.20
適応型マルチレート-AMR 3GPP TS 26.071 1999 200-3400 Hz FR / HR 7.95
適応型マルチレート-AMR 3GPP TS 26.071 1999 200-3400 Hz FR / HR 7.40
適応型マルチレート-AMR 3GPP TS 26.071 1999 200-3400 Hz FR / HR 6.70
適応型マルチレート-AMR 3GPP TS 26.071 1999 200-3400 Hz FR / HR 5.90
適応型マルチレート-AMR 3GPP TS 26.071 1999 200-3400 Hz FR / HR 5.15
適応型マルチレート-AMR 3GPP TS 26.071 1999 200-3400 Hz FR / HR 4.75
適応マルチレート-ワイドバンド、AMR-WB 3GPP TS 26.190 2001 50-7000 Hz フランス23.85
適応マルチレート-ワイドバンド、AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 23.05
適応マルチレート-ワイドバンド、AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 19.85
適応マルチレート-ワイドバンド、AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 18.25
適応マルチレート-ワイドバンド、AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 15.85
適応マルチレート-ワイドバンド、AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 14.25
適応マルチレート-ワイドバンド、AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 12.65
適応マルチレート-ワイドバンド、AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 8.85
適応マルチレート-ワイドバンド、AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 6.60
適応型マルチレートワイドバンド+、AMR-WB + 3GPP TS 26.290 2004 50-7000 Hz 6-36 kbit / s(モノ)
適応型マルチレートワイドバンド+、AMR-WB + 3GPP TS 26.290 2004 50-7000 Hz 7-48 kbit / s(ステレオ)


この表には、最新のモバイルネットワークで使用されるすべてのコーデックがリストされています。動的ビットレート(有用なデータと冗長データの比率がデータ回復のために変更される)のコーデックは、AMR-Adaptive Multi Rateと呼ばれます。 コーデックFR / HR / EFRは、GSMネットワークでのみ使用されます。



高速コーデックでエンコードされるデータの量を視覚化するには、次の図をご覧ください。







AMRからAMR-WBコーデックへの移行により、データ量がほぼ2倍になり、AMR-WB +にはさらに40〜50%のトランスポートチャネル幅が必要です。

そのため、モバイルネットワークでは、モバイルネットワークのブロードバンドコーデックがまだ幅広い用途に使用されていませんが、将来的には、たとえばコンサートのオンラインブロードキャスト用に、スーパーワイドバンド(AMR-WB +)に、さらにはフルバンドバンドに切り替えることも可能です。



そのため、音の振動ではなく、音声変換の第2段階を完了した後、デジタルデータのストリームをトランスポートネットワーク経由で送信できるようにします。

数字がアナログ信号に戻されるまで、このデータはほとんど変更されずに保存されます(音声配信の過程で、あるコーデックから別のコーデックへのトランスコーディングが発生する場合があります)。音声で発生するさらなる変換は、通話が送信される物理環境に関係します。



次の記事では、電話と基地局の間で何が起こるのか、ワイヤレスで生成したデータストリームがどのように奇跡的にオペレーターの機器に配信されるのかを検討します。







PSデジタル通信のトピックとその開発の歴史に興味のある人には、B.I。Kruk、G.N. Popovの著書「そして、世界は数字のカーテンの向こうにある神秘的」を強くお勧めします。 現代の標準と技術の観点からは、少し時代遅れですが、著者は理論と歴史の部分を完全に説明し、ドライ理論を生きた例とイラストで希釈しています。



All Articles