![画像](https://habrastorage.org/files/648/e8e/568/648e8e5689204c08a1a6fd35bfbc9c2c.png)
まとめ
おそらく、これは国際的な視聴者を持つサイトがこれに遭遇した場合です-すべてのユーザーが英語を読むわけではありません。つまり、人気のある言語にコンテンツ翻訳を追加することで視聴者を拡大できます。
ただし、サードパーティの翻訳サービスには費用がかかります。 さらに悪いことに、私たちのコンテンツはプログラミングと数学に満ちているため、すべての翻訳者が優れているわけではありません。
一枚の紙の価格を見積もった後、私はすぐにそれがまだ予算に収まらないことに気付きました。 他の方法を探し始めました。
私たちが行った決定、すなわち、
- カスタム翻訳にgithubを安価に使用した方法
- サイトの詳細が翻訳を妨げる方法
- ユーザーから助けを得ることがどれほど現実的か
- グーグル検索のために翻訳をマークする方法
- 最後に、翻訳されたコンテンツの効果がどれだけ見えるか(見えないか)
詳細については猫へようこそ!
予備計算
そのため、ここには英語のコンテンツを含むサイトがあります。 不完全な英語で。 ロシア語に翻訳できます。 同僚も。 強力なチームのこの言語能力は限られています。
私は、プロの翻訳サービスの費用を調べることから始めました。 Redditのトピックスレッドで、彼らは私に1単語あたり最低5セントと呼びました。 そして、ProZには兆候さえあります-ここで数字は完全に失望しています。
想像してみてください-少なくとも200の基本テキストがあります(つまり、これらは初心者、学生向けのタスクです)-ウィキの記事はカウントしません。 テキストの長さは100〜400ワードです。
平均長が200ワードで、200タスクを掛けると、40,000ワードになります。 5セントでは、単語は2,000ドルです。 5言語に翻訳された場合-1万。 あなたが10セントで数える場合-その後、20,000ドル。 より多くの言語がある場合、より多くのお金が必要です。
一部の中堅企業にとっては、これは少しのお金です-2015年の価格で100万ルーブルです。 しかし、私たちのチーム-ほんの2、3人の愛好家-と私たちのサイトは、利益を生み出すように設計されていません。 私たちはユーザーからお金を得ることはありませんが、良さの光線であり、一般的には満足しています。
ただし、優良サイトの光線は翻訳できません。
このアプローチにはまだ疑問があります:
- 翻訳者の仕事の質をチェックする方法-それは支払いに対応していますか? スペイン語、フランス語、中国語から英語に戻るグーグル翻訳?
- これらのコストが関連しているかどうかを事前に知る方法は? 翻訳に大きな需要がない場合はどうなりますか?
- ソーステキストと翻訳の形式-すべての翻訳者が、私たちが積極的に使用しているMarkDownを使用したいとは限りません。
ボランティア翻訳者としてのユーザー
もちろん、クラウドファンディングキャンペーンを発表し、翻訳者のためにユーザーからお金を集めることは可能です。 しかし、この時点で私は自然に思いつきました-ユーザーに母国語への翻訳を依頼する方が簡単ではないでしょうか?
問題の1つはすぐに除去されます-サイトのユーザーは確かに特別な用語に精通しています。 さらに、彼らはすでにこれらのテキストを読み、これらの問題を解決しており、複雑なフレーズを理解しやすいように表現するのが簡単です。
ただし、参加者は無料でサポートしたいと思いますか? 実際、多くの人にとって、問題は「無償」でさえありません。誰かがそれをすることに飽き飽きしているだけで、誰かに時間がありません。
それが判明することでした。 結果についてすぐにお知らせします-まだ1万人未満のアクティブユーザーがいます(サイトを一度見てもカウントされません)-現在、10人が翻訳に参加しています。 約0.1%-いずれにしても、誰も助けていない場合よりもはるかに優れています!
しかし、翻訳プロセスを技術的に整理する方法は?
ユーザーがコンテンツを編集する機能をサイトに追加しますか? それほど難しいことではありませんが、権利や修正の維持などに巧妙な制限を設けておくといいでしょう。
改訂について考えると、素晴らしいGitHubリソース(他の多くの目的で絶えず使用しています)を思い出しました。 次に、結果としてどのように機能するかを説明します。
GitHubに翻訳を保存する
自分でできるように、ロシア語への翻訳から始めました。
GitHubでプロジェクトを作成し、2文字の言語コード(ru、fr、de、esなど)に対応する名前のフォルダーを追加しました。 フォルダ内に、コンテンツの翻訳を含むファイルを配置します。 task-1.md、task-2.mdだけです。
github APIを使用するサイトは、そこからテキストを簡単に直接取得します(github上のAPIへのGETリクエストの場合は、認証さえ必要ありません)。 つまり ユーザーがタスクのスペイン語版に切り替えると、サイトはそれをデータベースからではなく、githubから直接レンダリングします。
利点の1つ-翻訳がオープンソースになる-これは私たちのボランティアにとって素晴らしいことです。 たとえば、学生は誇らしげに教授を見せることができます。ここでは、このサイトのIT記事を翻訳しています。
他の利点は、翻訳を追加する方法にあります。 2つ使用します。
- Gitを十分に理解しているユーザーは、自分でリポジトリのクローンを作成し、複数の翻訳ファイルを追加して、プルリクエストを実行できます。
- 残りはすぐにGitHubに要旨の形で翻訳を書き、プロジェクトにチケット(問題)を作成して、この履歴へのリンクを残すことができます-そして、コンテンツを自分自身などのファイルに転送できます。
もちろん、プロジェクトのルートにあるREADME.mdで詳細なプロセスを説明したので、参加者は通常、質問すらしません。
もちろん、翻訳は必ずしも完璧ではありません-しかし、フォーマットされたフォーマットを修正することができます(githubの同じ場所でファイルを編集することにより)-まあ、より重要なことは、他のユーザーが後で修正を提案できることを願っています。
サイトの技術的完成
もちろん、サイトの機能を拡張するには少し時間がかかりました。
翻訳された記事には、同じ2文字の言語コードの接尾辞が付いています。
サイトがgithubから取得するページの場合、サーバーでキャッシュが作成されました。 これまでのところ、真実は不必要であるため無効になっています(キャッシュなしで編集する方が便利です)。
SEOで-彼らは何か新しいものを発見しました-ページの先頭部分には、hreflang属性を備えたリンクが必要です-Googleが文句を言わないように。 終了するのは難しくありませんでした。正確にどのように見えるかを理解するよりも簡単です(各ページには、自分を含むすべての翻訳へのリンクが必要です!)
アラビア語に翻訳したユーザーは、テキストを右から左に表示するタスクを突然提示しました。 管理されています。
私たちにいくつかの論争を引き起こした問題は、ユーザーにページのローカライズされた(彼の言語の)バージョンをすぐに表示すべきかどうかです。 はい、ブラウザから言語を決定できますが、ユーザーは必ず満足するでしょうか? これまでのところ、彼らは母国語へのリンクを黄色で単純に強調することにしました。
達成された結果
これが最初から私が興味を持ったことです。 しかし、このベンチャーが役に立たない場合-ボランティアが助けに来ない場合-そして誰も翻訳を読まない場合はどうでしょうか?
3か月が経過しました。 最初のタスクは、ドイツ語(DE)、スペイン語(ES)、フランス語(FR)、アラビア語(AR)、中国語(ZH)、ルーマニア語(RO)、ロシア語(RU)に翻訳されています。
平均して、言語ごとに15のタスクが翻訳されます。 これは200からは程遠いですが、悪くはないと思います。翻訳は「絶対に新参者」に関連しており、その多くは5〜10の問題のみを解決します。 百人を超える人は通常、英語の十分な知識を持っています。
Googleアナリティクスでは、翻訳付きページビューがタスク付きページビューの合計数の約10%を占めるようになったことが示されています。 もちろん、ここでも2つの要因が影響を受けます。
Googleウェブマスターは、クリックの2%が翻訳されたページに来たと報告しています(十分ではないと思いましたが、Wikiなどを除くと平均7%が翻訳されていることに気付きました-そのため、割合は適切です)。
- サイトのインターフェース自体は翻訳されていないため、ユーザーには英語の基本的な能力が必要です-メニューの単語を認識するなど。
- もちろん、翻訳に興味のあるユーザーを巻き込むプロセスもある程度慣性があります。
一般的に、私たちはこの経験が本当に好きでした-だから私はそれを共有したかったです。 技術的な観点から、かなり原始的な方法を選択したと仮定します(はい、github、それだけです)-しかし、重要なKISSの原則に反することはありません-それをシンプルで愚かにしてください(本当に大好きです)。