Habrはいくらですか?

こんにちは、Habr! Smartcatと私は、2017年7月19日までにここで公開されたすべての投稿を夢中になって英語に翻訳し、Human VS Machineが翻訳する場合の平均費用を見積もることにしました。 カットの下で、あなたはそれから来たものを見つけるでしょう。







不要な入力なしで、 Smartcatからscalywhaleという単語を渡します。



8,729,613語



または62 397 253文字-habrahabr.ruの Webサイトにある大量のテキスト。



クライアント(主に翻訳会社)の間で最も一般的な方法:最初に、テキストが翻訳され、次にエディターがチェックし、次に修正者が修正します。 コンテンツの配信速度はその価値に直接比例するため、翻訳段階のみを終了しましょう。すべてのテキストがHabréで何度も繰り返されることはほとんどありません。







1日2500語-翻訳者は平均してそのようなスピードで作業できます。つまり、週末や休日がなくても、Habrのすべての翻訳に9年6か月間対応することができます。 この間、翻訳されたテキストは関連性を失い、さらに新しいテキストが追加され、翻訳者はおそらく頭を失います



Manを翻訳



経験豊富なネイティブ英語の翻訳者は、単語あたり平均0.08ドル(4.80₽*)かかり、 698 369ドル (41 874 973.45₽)になります。 プロセス管理コストを除く。







より速く試してみましょう-複数の翻訳者が一度にプロジェクトを引き受けることができます。Smartcatでは、1つのプロジェクトとドキュメントまで同時に作業できます。 50人のチームを編成し、その生産性は1日あたり12万5000ワードになります。 そのため、転送自体には70日かかり、コストは変わりません。 ここに2週間を追加して、適切な候補とテストを検索します。これは最小限の時間です。







SMT vs NMT



それでは、タスクをさらに速く完了させ、機械翻訳を使用してみましょう。 インターネットユーザーの大多数によると、このテクノロジは、文字通り迅速に何かを翻訳する必要がありますが、最近翻訳が非常にうまく開始されたため、翻訳業界は真剣に注目しています。 2016年の終わりにニュースを覚えておく必要があります。Microsoftの翻訳者がニューラルネットワークを使用して動作するようになったというニュースが最初に表示された、The New York Timesの記事が表示されました。ほとんど男のよう。



過去には、機械翻訳エンジンは大量のバイリンガルテキストから取得したルールと統計モデルに基づいたアルゴリズムを使用していたため、統計機械翻訳(SMT)と呼ばれています。 この新しい技術は人工ニューラルネットワークを使用します。人工ニューラルネットワークは、個々のフレーズではなく文全体のレベルで言語の深いつながりを個別に調査し、それに基づいてより正確で読みやすい翻訳を生成します。



機械翻訳



一般に、機械翻訳が役立ちます。 わかりやすくするために、この記事ではHabr842ワードの量で取り上げ ます 。 ライブ翻訳者が約3時間で管理し、67.4ドル(₽4,041.38)を要求します。 彼にとってそれをより簡単にし、同時に節約しましょう。 翻訳は機械に、編集は人に任せます。



この翻訳方法は事後編集と呼ばれ、特別なスキルが必要です。 投稿編集者は言語を知っているだけでなく、機械翻訳の仕組みも理解している必要があります。



そこで、機械翻訳を接続し、 Smartcat Webサイトからポストエディターを探します。 Word文書に記事のテキストを入力し、Microsoft Translatorを介して予備翻訳にチェックマークを付けます。 このサイトでは、翻訳するだけでなく、ネイティブ英語のポストエディターを含む世界中のフリーランス翻訳者を探すこともできます。







ポストエディターサービスは、翻訳サービスよりも安価です。 単語ごとに0.022ドル(1.32ドル)を要求するフリーランサーの女の子を見つけました。 合計で、テキストの翻訳には18.5ドル(1109.28ドル)かかります。 ポストエディター自身によると、彼女は自分が翻訳した場合よりも早く-2時間でタスクに対処しました。 機械翻訳エンジンとして、 Microsoft Translatorの有料版を使用しました。これは、より良い翻訳が必要です。 関税S1で数値を再計算します。







その結果、このようなスキームによる転送は、75%収益性が高く、1/3速くなります。 機械翻訳を使用して50人の編集者を雇えば、Habr全体を48日間192 675ドル (11 553 004.94₽)で翻訳できることがわかります。



ご意見



機械翻訳の使用は、プロの分野で非常に効果的ですか? お客様からいくつかの意見を収集しました。



B2B-Center電子取引プラットフォームの責任者であるAleksey Dyagterevは、外国企業をサイトに引き付けようとしていると言います。 以前は、最も重要な手順のテキストのみが手動で英語に翻訳されていました。これは全ロットの約10%です。 現在、国際的な視聴者の機械翻訳のおかげで、毎日サイトに公開されている5,000ロットすべての見出しと説明が利用できます。 翻訳の品質は許容範囲です-情報を見つけて詳細を明確にすれば十分です。



機械翻訳とSmartcatシステムとの統合のおかげで、日常業務が自動化され、資格のある従業員の使用効率が大幅に向上しました 。」


ロシア最大の翻訳会社Logrus ITの部門長であるFedor Bezrukov氏は、新技術にはある程度の意味があると主張していますが、それほど単純ではありません。



最近、ロシア語から英語への900語のボリュームを持つ技術テキストの翻訳の緊急の注文を受けました。 Microsoftの統計(SMT)とニューラル(NMT)、Googleの統計の3つの機械翻訳エンジンが同時に接続されました。 そして、スタイルと文法をチェックするために-文法プラグインも。 Microsoft NMTとGoogle SMTは、最も成功した翻訳を作成しました。 翻訳は1時間40分で完了し、プロセスは翻訳者によって制御されました。 1時間あたり500ワードの生産性を達成したことがわかります 。 "



ヒョードルによると、統計的機械翻訳とニューラル機械翻訳の違いは、ニューラル翻訳者が一貫性のあるテキストを生成することですが、危険があります。結果はよく読まれたナンセンスになる可能性があります。



「この段階では、いくつかのエンジンの出力を使用して、それぞれの利点を組み合わせ、欠点を平準化することを好みます。 NMTエンジンを訓練し、専門用語をその場で教えることができると、プロセスはまったく新しいレベルに到達します。


Weeblyの同僚から最近連絡があり、13か国語で製品をローカライズすることにしました。 プロジェクトが大規模であるだけでなく複雑であることがすぐに明らかになりました-サイトのテキストコンテンツはシステム全体に分散され、さまざまな形式で保存され、さらに絶えず変更および更新されています。 洗練されたソリューションが見つかりました。APIを介したWeeblyウェブサイトの統合のおかげで、テキストは処理され、翻訳され、余分な労力なしでウェブサイトに戻されました。 作業をスピードアップするために、5〜10人のチームが各言語への翻訳に取り組みました。これは何百人もの翻訳者です。 機械翻訳を積極的に使用しました。翻訳を高速化し、レイアウト上の異なる言語のテキストをチェックするためです。



Smartcatチームはあらゆる段階で私たちをサポートしてくれました。 疑問が生じたり、新しいタスクが突然登場したときはいつでも、彼らが彼らの経験を助けたり共有したりすることを期待できます。 Smartcatのおかげで、Weeblyウェブサイトを13の言語で効率的かつ短時間でローカライズでき、翻訳者の検索やタスクの配布からデータの管理、プロジェクトへの自動ソリューションの統合まで、あらゆる段階でプロセスを効果的に管理できました 。 Nieblas Olucha Sanchez、Weeblyローカリゼーションマネージャー。



「Weeblyプロジェクトは簡単ではなかったため、興味深いものでした。 Smartcatでは、翻訳コミュニティを開発し、スマートテクノロジーを作成して、企業がビジネスを簡単に拡大できるようにしています。 私たちを使えば、アーティストを簡単に見つけたり、チーム全体を組み立てたり、機械翻訳エンジンを組み合わせたり、用語集と翻訳メモリを接続したりすることができます。 難しいタスクが大好きです-書いてください!」Smartcatのプロダクトマネージャー、Sergey Andreev


*記事全体を通して、変換は2017年8月10日のロシア連邦中央銀行のレートで$からisになります。 サイトからのデータ。



著者について



Pavel Doronin-ローカライズ、翻訳、およびこれに関連するすべてが大好きで、これに最適なツールの作成に取り組んでいます。 彼はまた、電子音楽とシンセサイザー(仕事の後)が大好きです。 #i18n#l10n#xl8n



All Articles