ロヌカリれヌションの革新的な技術

画像画像



Loc Kitロヌカリれヌション䌚議の準備ずしお、 スピヌカヌずのコミュニケヌションを続けおいたす 。 今回は、倚蚀語ロヌカリれヌション郚門の責任者であるABBYY Language Services Nadezhda Batyukovaの代衚者ず、むノベヌションディレクタヌのAnton Voronovにいく぀かの質問をしたした。



-あなたの仕事に぀いお教えおください。 䜕で構成されおいたすか



Nadezhda Batyukova゜フトりェア、りェブサむト、コンピュヌタヌゲヌム、さたざたな蚀語のマヌケティング資料のロヌカラむズを実行し、倚蚀語の甚語集を線集し、蚀語テストを実斜しおいたす。 郚門マネヌゞャヌは顧客ず察話し、プロゞェクトの実行者を遞択し、倚段階のロヌカラむズプロセスを管理し、品質管理を提䟛したす。



-ロヌカリれヌションプロセスは技術的にどのように構築されおいたすかどのテクノロゞヌず゜フトりェアを䜿甚しおいたすか



Nadezhdaロヌカリれヌションは興味深く、耇雑なタスクです。 独自の蚭蚈のさたざたな゜フトりェア補品を䜿甚しお、䜜業を最適化したす。 Lingvo.Proは、甚語を管理し、プロゞェクトのすべおの蚀語リ゜ヌスを䞀元的に保存するのに圹立ちたす。 クラむアントの倚くは、この゜リュヌションを䜿甚しお、䌁業内で甚語集を敎理しおいたす。



私たちはさたざたなファむル圢匏で䜜業しおいるため、材料を垞にCATツヌルに倉換する必芁がありたす。 以前は、これらの目的のために、圓瀟の゚ンゞニアはプロゞェクトごずに特別なナヌティリティを䜜成したした。 翻蚳ず統蚈のカりントのためにテキストを抜出し、コヌドずタグを保存し、元の圢匏でファむルのアセンブリを自動化するのに圹立ちたした-぀たり、マネヌゞャヌが行ごずに倚くの蚀語に手動で翻蚳を挿入する必芁性を節玄したした。 たた、甚語の統䞀性ず翻蚳のデザむンの自動チェックのための開発を䜿甚したした䜙分なスペヌスの欠劂、句読点の䞍䞀臎、および原文ず最終テキストの文字の倧文字など。 珟圚、自動化の基瀎はSmartCATであり、これは倚くの個別のナヌティリティを埐々に眮き換えおいたす。



Anton Voronovロヌカリれヌションは倚段階のプロセスであり、ここではすべおの段階間の接続が特に重芁です。 珟圚、䌚瀟の翻蚳プロセスの䞻芁郚分はSmartCATを採甚しおいたす。 コネクタを远加するこずで成長し、さたざたな゜フトりェアの䜿甚方法などを孊習したす。コネクタを䜿甚するず、ロヌカラむズプロセスをコヌドリポゞトリず統合できたす。 私たちが知っおいるように、開発者は゜フトりェアを䜜成するずき、コヌドを曞いおリポゞトリに入れたす-䟋えば、GitHubやSVN。 コネクタのおかげで、プログラムが特定のリポゞトリに入り、ロヌカラむズの準備ができたらすぐに、翻蚳を進めるこずができたす。 メヌルで䜕かを送信する必芁はありたせん。゜ヌスファむルをリポゞトリに取り蟌み、翻蚳しお完成したテキストを同じリポゞトリに配眮したす。 たた、開発者はプログラムのロヌカラむズ版をすぐに構築できたす。



-よく䜿甚する蚀語は䜕ですか



垌望私たちの資産には80以䞊の蚀語ペアがありたす。 私たちは䞖界䞭の翻蚳者ず協力しおおり、倚くの堎合、ロヌカラむズはロシア語぀たり、ある倖囜語から別の蚀語ぞの参加なしに行われたす。 英語からペヌロッパの䞻芁蚀語いわゆるFIGフランス語、むタリア語、ドむツ語、スペむン語ぞのロヌカラむズは、ほずんどすべおのお客様に求められおいる基本セットです。 平均しお、プロゞェクトごずに8〜10の蚀語ペアがありたす。FIG、ポヌランド語、チェコ語、トルコ語、アゞアの䞀般的な蚀語日本語、䞭囜語、韓囜語です。 そしお、これは制限ではありたせんたずえば、Hamsetrsoftの堎合、サむトの゜フトりェアず玠材を40蚀語で定期的にロヌカラむズしたす。他のクラむアントのプロゞェクトは、蚀語数の絶察的な蚘録保持者ですこのプロゞェクトの䞀環ずしお、䞖界の100の異なる蚀語でロヌカラむズを行いたした。



  -別の蚀語ぞのロヌカラむズの興味深い䟋や特城に出䌚ったこずがありたすか



垌望通垞、奜奇心は、゜ヌスずロヌカラむズされたテキストの曞き蟌み方向巊から右ではなく、右から巊、句読点の芏則、たたは単語゜フトりェア補品の名前を含むの意味に違いがある堎合に発生したすクラむアントに詳しくない。 たずえば、スペむン語のファむルから異垞な句読点を削陀しないように顧客を説埗したした。蚀語の芏則に埓っお、質問ず感嘆笊は文の先頭で䞊䞋逆に耇補されたす。



たた、ロヌカラむズのプロセスでは、タヌゲットオヌディ゚ンスに適合させるために、テキストから特定の珟実を陀倖する必芁がある堎合がありたす。 たずえば、むスラム諞囜向けのバリアントで1぀のカタログを䜜成する堎合、顧客ず合意しお、アルコヌルず䞋着に関連するものはすべお削陀されたした。 別のケヌスでは、アメリカのクむズをロシア垂堎に適応させるずきに、いく぀かのトピックが曞き盎されたした。 特に、私たちにはあたり人気のない野球は、フィギュアスケヌトに眮き換えられたした。



  -ロヌカラむズ品質管理プロセスはどのように構築されおいたすか



垌望プロゞェクトの開始前に、倚蚀語甚語集を線集したす。テキストから甚語を抜出し、必芁な蚀語に翻蚳しお、お客様から承認したす。 クラむアントが独自の甚語集を持っおいる堎合は、それを基瀎ずしたす。 Lingvo.Proは、特に顧客が゜リュヌションむンタヌフェむスで盎接䜜業に接続するため、甚語の関連性を維持するのに圹立ちたす。



3段階の䜜業プロセスがありたす。翻蚳者の埌、゚ディタヌはテキストを芋お、次に修正者を調べたす。 すべおのパフォヌマヌは、それぞれの囜に䜏んでいる蚀語のネむティブスピヌカヌです。 蚀語ごずに、専門家のチヌムがありたす。トピックごずに別々のチヌムがありたす。 経隓から蚀うず、1人の人が異なる蚀語やトピックで同じようにうたく働くこずはありたせん。たずえば、技術、法埋、医孊分野でトルコ語、日本語、セルビア語を話したす。



同瀟には品質管理郚門もあり、その職務は実行者を蚓緎し、完了した泚文の品質を定期的に監芖し、䞖界のあらゆる蚀語で詊隓を実斜するこずです。



そしお最埌に、テキストのすべおの䜜業段階の埌、独自のツヌルを䜿甚しお最終的な自動チェックを実行したす。すべおが正しいかどうか、䜙分なコンマがなくなった堎合は甚語集に関連する甚語であるかどうかを確認したす。



アントン品質管理は非垞に骚の折れる綿密な䜜業ですが、必芁な䜜業であるため、このプロセスを可胜な限り自動化するこずが非垞に重芁です。 そのため、SmartCATでは、この領域に特別な泚意を払おうずしおいたす。珟圚、自動チェックが非垞に求められおいたす。 たた、ナヌザヌがコンテキストで情報を衚瀺し、むンタヌフェむスで翻蚳がどのように芋えるかをテストできるようにするために取り組んでいたす。このため、さたざたなタむプのコンテンツ甚の特別なビゞュアラむザヌを開発しおいたす。



-あなたは蚀語テストに぀いお蚀及したした。 これはどのようなサヌビスで、品質管理に関連しおいたすか



垌望蚀語テストはロヌカラむズの最終段階であり、品質管理プロセスの重芁な芁玠です。 ロヌカラむズされたファむルは実際のシェルに埋め蟌たれ、゚キスパヌトがコンテキストで評䟡し、承認された蚈画に埓っお画面ごずに衚瀺したす。 テスト䞭に、スペシャリストはすべおの欠点を特別な圢匏バグレポヌトで修正し、顧客ず合意しお䜜業ファむルに入力する修正オプションを提䟛したす。 蚀語テストは1時間ごずに課金されたす。 関皎は蚀語が異なり、出挔者の仕事の費甚に䟝存したす。



残念ながら、堎合によっおは、ロヌカラむズプロゞェクトの緊急性が「昚日」であるため、顧客はテストフェヌズをスキップするこずを䞻匵したす。 しかし、実践が瀺すように、それは倚くの時間を節玄し、その埌、たずえば远加の線集や承認に費やされたす。最終アセンブリの段階で、テキストが長さに沿っお通過しないなどが刀明した堎合



  -5幎埌のロヌカラむズプロセスをどう芋おいたすか



アントン今日、業界にはいく぀かの重芁な傟向がありたす。5幎埌にはロヌカリれヌションプロセスに慣れるでしょう。



たず第䞀に、これは統合です倚段階のロヌカリれヌションプロセスは統䞀された゜リュヌションに基づいお構築され、手䜜業の圹割が削枛され、プロゞェクトの成功はパフォヌマヌ間のコミュニケヌションに䟝存しなくなり、コンテンツはコネクタを介しお盎接送信されたす。



専門的な機械翻蚳の圹割が増加したす。倚くのお客様は、この技術では高品質の結果を埗るこずができないず考えおいるため、ポスト゚ディティングによるMTを恐れおいたす。 それにもかかわらず、将来はプロの機械翻蚳にありたす-翻蚳メモリず甚語集の蚀語リ゜ヌスぞのアクセス、「゚ンゞン」の蚭定、ポスト゚ディティングおよびその他の凊理段階。



ロヌカラむズ蚀語の数も増加したす。 以前は、ネットワヌク䞊の芖聎者の90を理解するには、5〜10の蚀語で十分でした。 珟圚、18〜20の蚀語が必芁になりたす。たすたす倚くの囜がオンラむンになり、モバむルテクノロゞヌが開発され、さらにグロヌバル化のプロセスが進行䞭です。



ロヌカリれヌションプロゞェクトにおける共同䜜業の圹割は間違いなく増加したす。



-そしお、あなたの意芋では、このような自動化の䞖界で5幎埌にプロゞェクトマネヌゞャヌずなるこずは䜕ですか



Nadezhda 5幎埌の優れたプロゞェクトマネヌゞャヌは、少なくずもJ



オヌトマチックトランスミッションを搭茉した車もありたすが、これはドラむバヌなしで行けるずいう意味ではありたせん。 ロヌカリれヌションに぀いおも同様です。SmartCATを䜿甚するず、プロゞェクトマネヌゞャヌがプロセスを制埡しやすくなりたす。 新しい技術を導入しおも、ロヌカリれヌション郚門のスタッフが倧幅に枛るこずはないず確信しおいたす。 むしろ、䜜業はより効果的になり、プロセスの開発により倚くの時間があるでしょう。



アントンロヌカリれヌションプロゞェクトマネヌゞャヌはこのプロセスにさらに関䞎し、技術的に有胜になるず思いたす。 䞀般的に、圌らは珟圚、他の翻蚳郚門のマネヌゞャヌよりも技術的な偎面をよく理解しおいたす。蚀語だけでなく、゚ンゞニアリングの胜力も持っおいるからです。 プロの翻蚳゜フトりェアの分野の知識は、劎働垂堎の異なるレベルでの競争に぀ながりたす。 したがっお、テクノロゞヌ䌁業で働いおいる堎合-これは1぀のこずであり、叀いやり方ですべおを「ひざの䞊で」行う堎合、これはたったく異なりたす。



  -クラりド゜ヌシングの䜿甚に぀いおどう思いたすか



アントン私たちはクラりド゜ヌシングに察しお前向きな姿勢を持っおいたす。 同じロヌカラむズで、適切な組織で、補品のアクティブナヌザヌである人々、そのファン、およびほずんどの開発者がそれに぀いお知っおいる翻蚳に関䞎できたす。 しかし、圌らは本圓に補品に利益をもたらしたいず思っおいたす。これは異なるレベルの動機です。 明らかな利点の1぀は、そのような翻蚳者がすでにコンテキストに没頭しおいお、䞻題に粟通しおいるこずです。



プロのシナリオでは、チヌムワヌクを積極的に䜿甚し、補品にこの領域を実装しお、クラりド゜ヌシングの基盀を築きたす。 たずえば、SmartCATは、ボランティアがCourseraの教育リ゜ヌスに関する講矩を翻蚳するプロゞェクトである「Transcourse Coursera」の基瀎です。 結果は感心せざるを埗たせん。これらの人々はわずか3か月で最初の100䞇語を翻蚳したした。 しかし同時に、クラりド゜ヌシングは倚くの深刻な問題を匕き起こすこずを理解しおいたす。それは、倚数のパフォヌマヌの動機付け、胜力の評䟡、コミュニティ管理、および技術の開発です。 最近、Slon.ruの特別コラムでこれに぀いお詳しく説明したした。



-なぜ翻蚳自動化のための独自の技術を開発するこずに決めたのですかたた、これたでどのような成果を達成したしたか



アントン翻蚳プロセスを自動化するためのさたざたな専門技術゜リュヌションは、プロセスのさたざたな段階で有益です。 しかし、コンテンツの䜜成から抜出、翻蚳者の䜜業に至るたで、ロヌカリれヌションプロセス党䜓が継続的に自動化されるず、真のブレヌクスルヌが始たりたす。 さらに、利甚可胜な゜リュヌションは、倚くの堎合、重量があり、孊習ず適応が難しく、たた、急速に進化するプロセスずタスクに垞に察応するずは限りたせん。 圓瀟は垞に、すべおのプロセスの高床な自動化によっお区別されおいるため、ビゞネスのすべおの偎面を自動化する単䞀の゜リュヌションを開発するずいう難しい遞択がなされたした。 その結果、今日、圓瀟はこれらの技術を瀟内で䜿甚するだけでなく、ABBYYSmartCAT、Lingvo.Pro、 Perevedem.ruなどの補品の圢で垂堎を提䟛しおいたす。 すべおの結論に぀いお話すのは時期尚早ですが、私たちが受け取った最初の結果は、遞択された経路の正確さに぀いお述べおいたす。



All Articles