言葉の壁を乗り越えて-今から6年間!

Franz Och、Google翻訳チームの科学研究者



インターネットの発展により、20億人以上のユーザーが世界のすべての知識を利用できます。 検索エンジンでの短いリクエスト-あなたはすでにあなたから数千キロ離れたサーバーに保存されているウェブページにいます。 数回のクリック-そして、あなたは地球の反対側にいる人からのメッセージを読みます。 しかし、必要な情報がヒンディー語、アイスランド語、またはアフリカーンス語であり、ロシア語しか話せない場合、またはその逆の場合はどうでしょうか?



2001年、Googleは8つの言語から英語へ、またはその逆の翻訳を可能にするサービスを開始しました。 その主な機能は、当時の最先端の有料機械翻訳システムでしたが、品質は最高水準ではなく、数年にわたってこのシステムはわずかに改善されました。 2003年に、Googleのエンジニアは翻訳の品質を向上させ、言語の数を増やすことを決定しました。 それが私がこのプロジェクトの仕事を始めたときです。 当時、私はまだ防衛省の高度な研究開発部(DARPA)のプロジェクトの研究者であり、機械翻訳への新しいアプローチを研究していました。これは非常に有望であり、翻訳の品質を大幅に向上させると認識されている自己学習システムです。 彼らはGoogleから電話をかけてきました(そして、私は非常に懐疑的でした!)このアプローチは、データ分析に基づいて、Googleで特に機能するだろうと確信しました。



私はチームに加わり、翻訳システムの作り直しを始めました。 米国国立標準技術研究所(米国)が実施する機械翻訳認証に参加しました。 これは、機械翻訳システムを改善するために設計された、研究機関や企業の間での一種の大賞です。 Googleの計算能力と大量の情報を処理する能力のおかげで、私たちは良い結果を達成しました。 この瞬間が転機となりました。データ分析に基づくアプローチがどれほど効果的であるかが明らかになりました。



しかし同時に、私たちのシステムは非常に遅く、非実用的でした。1000台のコンピューター技術が1000文の翻訳に取り組み、やがて40時間かかりました。 スピードに重点を置き、1年後、システムはすでに1秒もかからずにオファーを翻訳でき、品質は著しく高くなりました。 2006年の初めに、この技術は英語-中国語および英語-アラビア語の翻訳で使用されるようになりました。



2006年4月28日に統計的機械翻訳を発表しました 。 過去6年間、翻訳の品質と言語数の増加に最大の注意を払ってきました。 Google翻訳は、ウェブではあまり表現されていない言語(ベンガル語、バスク語、スワヒリ語、イディッシュ語、さらにはエスペラント語など)を含む64の言語で動作するようになりました。



現在、 translate.google.comには月に2億人以上のアクティブユーザーがアクセスしています(さらに、Chrome、YouTube、モバイルアプリケーションなど、サービスをサポートする他のプログラムも考慮しています)。 言語の障壁は旅行に特に関係するため、ユーザーは外出先で翻訳者を使用することも好きです。統計によると、モバイルトラフィックの使用は年々4倍以上に増加しています。 翻訳者の聴衆は真にグローバルです。モバイル翻訳者のトラフィックの92%は米国外から来ています。



私たちが毎日翻訳するテキストの量は、約100万冊に相当します。つまり、年間のプロによる翻訳のほぼ全量です。 これらの数字から、今日の地球上のほとんどの翻訳がGoogle翻訳者によって行われていることが明らかです(おそらく、銀河系では、ダグラスアダムスの「 バビロニアの魚 」が私たちよりも先を行くかもしれません)。 もちろん、ニュアンスと正確さを詳細に伝える点でプロの翻訳者と競合するものはありません。 機械翻訳は、より多くの人々が母国語でグローバルな対話を行うのに役立つと確信しています。 この場合、プロの翻訳者の役割はさらに重要になります。



今日、私たちは、どの言語で表示されているかに関係なく、誰もが情報を受け取り、他の人と共有できる未来を夢見ています。 Chromeブラウザのリアルタイムウェブページ、携帯電話で撮影した写真のテキスト、YouTubeのキャプション、さらにはスマートフォンを使って話すことも既に翻訳しています。 私たちは人々の間の言語の壁を打ち破りたいと思っています-次の6年間で私たちを待っているものを見てみましょう!







All Articles