新華社通信は、ヒューマンアナウンサーを合成音声CGIモデルに置き換えました





未来は徐々に近づいており、テクノロジーは私たちの生活のあらゆる領域にますます深く浸透しています。 1つの症状は3Dテクノロジーです。 最近、中国の報道機関である新華社がニュース番組に仮想アナウンサーを使用することを決定したことが明らかになりました。



どの技術革新がモデルの作成に使用されたかはまだ明確ではありませんが、仮想スピーカーは非常に現実的に見えます。 はい、彼はニュースを少し単調に読み、時々表情をもたらしますが、すべてが正常範囲内にあります。





代理店は、モデルに実在の人物の動きと表情を使用しました-これは非常に頻繁に行われます。 「プロトタイプ」は、Zhang Zhao社の実際の従業員でした。 アナウンサーの声は完全にコンピューターですが、多くの「オンスクリーンアナウンサー」のように単調ではありません。 ところで、新華は中国のニュースの仮想モデルも持っています。 画像、表情は音声に重ねられているため、明瞭度はほぼ自然に見えます。 人工知能は、音声と「画像」の処理に役立ちます-プロジェクトでは、一連の特殊なアルゴリズムが使用されます。



モデルは、テクノロジースタートアップのSogouを使用して開発されました。 プロジェクトの代表者によると、仮想アナウンサーには「無限の可能性」があり、その使用は人と仕事をするよりも会社にとって安価です。



仮想ニュースリーダーは、少なくとも1日間は、望む限りニュースを読むことができます。 限られた顔の表情と合成音声については、会社が改善することを約束します。テクノロジーが非常に急速に開発され、徐々に改善されているのは良いことです。 実際のリーダーとアナウンサーを仮想のリーダーと区別できないときは、そう遠くありません。



All Articles