「コースラの翻訳」:世界最高のコースをロシア語に翻訳するためのプラットフォームの作り方

3月24日、ABBYY Language ServicesとDigital October Centerは、クラウドファンディングプロジェクト「 Translate Coursera 」の正式な立ち上げを発表しました。 その目標は、最高のCourseraコースをロシア語に翻訳し、すべてのRunetユーザーがアクセスできるようにすることです。 プロジェクトのWebサイトで、今すぐ講義を登録して翻訳を開始できます。



このプロジェクトを立ち上げて開発する準備をしている間に、多くの興味深いことが起こりました。 私たちは多くの組織的および技術的な問題を解決し、このプロジェクト「Digital October」で地元のパートナーのチームだけでなく、明るいチームとCourseraの創設者を含む多くの興味深い人々に会いました。 テクノロジーについて学ぶことはあなたにとってより興味深いと思うので、それが何で構成され、私たちが開発したプラットフォームで何ができるかをお話しします。 これはほとんど間違いなくプロジェクトに関する最後の投稿ではないので、他に知りたいことについてのコメントを書いてください。



開発は昨年始まり、昨日までプラットフォームはクローズドベータテスト段階にあり、ABBYY、Digital Octoberの従業員、モスクワ州立大学、ロシア国立人道大学、モスクワ市心理学および教育大学の学生および若い専門家が参加しました。および他の大学。 最初の翻訳者のコメントのおかげで、私たちのスペシャリストはプラットフォームを完成させ、より便利にし、仕事の準備を完全に整えることができました。



このリソースは、SmartCATの翻訳を自動化するためにABBYY Language Servicesによって開発されたクラウドプラットフォームに基づいています。 ご存知のように 、このシステムを使用すると、翻訳メモリ、用語の整合性の自動サポート、機械翻訳など、翻訳業界の最新テクノロジーを使用できます。 これらはすべて、ユーザーの生産性を最大化するように設計された便利なエディターインターフェイスで収集されます。 「Translate Coursera」では、これらの専門技術がすべての来訪者に利用可能です。仕事に「含める」ために、特別なトレーニングは必要ありません。 プロジェクトをボランティアにとって興味深いものにするために、開発者はシステムにいくつかの追加機能を追加しました。これについては以下で説明します。



誰でもプロジェクトWebサイトに登録し、好きなコースを選択して作業を開始できます。 講義のテキストは文章に分かれており、翻訳の時間枠はありません。参加に費やす時間を決めるのはあなただけです。2〜3文または20ページを翻訳してください。 この場合、最良の選択ができない場合は、各文に対して複数の翻訳オプションを追加できます。



登録後、各参加者には独自のプロファイルがあり、個人データに加えて、他の参加者の翻訳されたオファー、評価、翻訳されたコースおよび投票結果の数に関する情報が表示されます。 ボランティアは仕事の過程で互いに翻訳について話し合うことができ、最も勤勉な人はその成果に対して実質的な報酬を受け取ります。



同様に重要な段階は、最良の翻訳オプションの投票です。 翻訳エディターで直接投票できます。 サイトには特別なウィジェットもあります。



次に、翻訳オプションが承認のために専門家に送信され、コースラで字幕が付けられます。 専門家は、対応するロシアの大学の専門分野の教師です。



ユーザーアクティビティは、個人の評価として表されます。 メインページにはプロジェクトリーダーのリストがあり、参加者は最も活発な翻訳者Courseraのタイトルを競います。

リーダー

評価は、次のパラメーターで構成されます。

1.ユーザーが追加した翻訳の数。

2.このユーザーの翻訳のために投じられた他の参加者の投票数。

3.他の人の転送に対してユーザーが投じた票の数。

4.エキスパートが最終として選択したユーザー翻訳の数。

評価への最大の貢献はパラメータ2と4で与えられます。したがって、翻訳は少ないが有利です。



前述のように、プラットフォームには用語の完全性サポートが自動化されています。 翻訳されたコースごとに用語集がプリコンパイルされます。特別なプログラムが講義を分析し、頻繁に発生する単語を選択します。 結果の用語のリストは、ABBYY Language Servicesの経験豊富な編集者によってチェックされ、余分なものを「除外」して翻訳します。これにより、ソース言語とターゲット言語の用語のペアが判明します。 翻訳者の作業インターフェースでは、システムは用語を強調表示し、翻訳を表示し、フィールドを編集用に置き換えることができます。 これにより、コース全体の翻訳の均一性と完全性が保証されます。



翻訳エディターには、ユーザーが翻訳中のビデオコースを表示できる特別なパネルがあります。 まず、テキストの意味をよりよく理解するのに役立ちます。 次に、プロジェクトの各参加者は、講義のビデオクリップで翻訳オプションがどのように見えるかをすぐに確認します。編集時には、ユーザーはリアルタイムでビデオの字幕の変化を監視し、字幕ラインの転送場所を手動で設定できます。 したがって、参加者は画面上で調和して見える翻訳用のフレーズを選択することができます。 さらに、このシステムを使用すると、ユーザーが現在翻訳しているフラグメントにビデオをすばやく巻き戻すことができます。逆もまた同様です。現在聞いている文に移動します。 ビデオを表示するために、オープンソースのWebプレーヤーを使用しました。 APIを介して.srtファイルの形式で受け入れる字幕を再生できます。SmartCATは、翻訳テキストを動的に字幕行に分割し、それらから.srtファイルを生成してプレーヤーに転送します。

エディター



プラットフォームの開発の詳細についてお伝えしたいと思いますが、私たちの専門家は今では気を散らすことができないので、少し後で他の技術的な詳細を紹介します。 それまでの間、 Courseraの翻訳に参加してください! すべての質問、提案、提案を当社のアドレス(coursera@abbyy-ls.com)に送信するか、コメント欄に投稿してください。 プロジェクト、そのミッション、およびCourseraの詳細については、 ブログをご覧ください。



All Articles