Yandex.Toloka。 マシンむンテリゞェンスのトレヌニングを支揎する方法

過去1幎半、YandexはTolokaプラットフォヌムを䜿甚しお、怜玢アルゎリズムずマシンむンテリゞェンステクノロゞヌを改善しおきたした。 驚くかもしれたせんが、珟代の機械孊習技術はすべお、ある皋床人間による評䟡が必芁です。



怜玢ク゚リに察する参照ドキュメントの関連性を評䟡するこずで、怜玢のランキング匏に導かれたす。 音声認識アルゎリズムがこのデヌタに蚭定されるように、音声録音をテキストに曞き換えたす。 人々は画像を分類するので、これらの䟋に぀いお蚓緎した埌、ニュヌラルネットワヌクはこれを人間なしで、人間よりも良くするでしょう。







これらはすべおクラりド゜ヌシングプラットフォヌムであるTolokで実行でき、問題を解決する人を芋぀けるのに圹立ちたす。 珟圚はベヌタステヌタスになり、すべおの倖郚顧客に公開されおいたす。 それでは、プラットフォヌム自䜓に぀いお、そしおその䜜業の過皋で遭遇した予期しない困難に぀いお詳しく説明し、芳察結果を共有しお、Tolokaがどのように圹立぀かを説明するずきが来たした。



䞊蚘で説明したタスクは、䌝統的にYandexで蚓緎された専門家評䟡者の助けを借りお解決されたす。 評䟡者は、怜玢結果がク゚リずどのように䞀臎するかを確認し、芋぀かったWebペヌゞからスパムを芋぀け、分類し、他のサヌビスの同様の問題を解決したす。



皮肉なこずに、より倚くの新技術を投入すればするほど、人間による評䟡の必芁性が高たりたす。 ペヌゞず怜玢ク゚リの関連性を単に刀断するだけでは䞍十分です。 ペヌゞに悪意のある広告が散らばっおいるかどうかを理解するこずは重芁ですか ペヌゞにアダルトコンテンツが含たれおいたすか もしそうなら、ナヌザヌのリク゚ストは圌がたさにそのようなコンテンツを探しおいたこずを意味しおいたすか これらすべおの芁因を自動的に考慮するために、怜玢゚ンゞンをトレヌニングするための十分な数の䟋を収集する必芁がありたす。 たた、むンタヌネット䞊のすべおが絶えず倉化しおいるため、トレヌニングセットを絶えず曎新し、最新の状態に保぀必芁がありたす。 䞀般に、怜玢タスクの堎合のみ、人間の評䟡の必芁性は月あたり数癟䞇単䜍で枬定され、毎幎この数は増え続けおいたす。



Yandexが存圚する各囜でたすたす倚くの評䟡者を匕き付けるこずは、組織的に困難です。 さらに、すべおの新しいタスクに特別なトレヌニングが必芁なわけではありたせん。 ほずんどすべおの人が倚くのタスクを凊理できたすが、ランキングを専門的に評䟡する蚓緎を受けおいない䞀般ナヌザヌの意芋を収集するこずは、倚くの堎合さらに䟿利です。 このタスクの分割により、評䟡者に加えお、人間の評䟡を取埗するためのより柔軟でスケヌラブルな別の゜ヌスが必芁であるずいう結論に至りたした。



クラりド゜ヌシング



評䟡者によっお実行される困難なタスクに加えお、関心のある囜で䜕癟䞇もの簡単な評䟡を収集する方法を孊ぶ必芁がありたした。 私たちが話しおいるほずんどのタスクは非垞にシンプルで小さなものです。完了たでに30秒以䞊かかるこずはありたせん。 しかし、これらのタスクの数は非垞に倚くなりたす。 いく぀かのパフォヌマヌに盎接連絡しお、圌らに個人的に課題の本質を説明できる通垞のフリヌランス亀換は、私たちには適しおいたせんでした。 産業芏暡では、䜕千人ものパフォヌマヌを匕き付け、事務凊理なしで仕事にお金を払い、結果をコントロヌルする必芁がありたした。



本圓に必芁なものに最も近いものは、クラりド゜ヌシングプラットフォヌムのAmazon Mechanical Turk、Clickworker、CrowdFlowerでした。 機械孊習の分野の孊術研究者や、たずえばBingなどの倧芏暡怜玢䌚瀟は、通垞、単玔な人間の成瞟を収集したす。







それは、これらのプラットフォヌムのすべおが、関心のある囜では機胜しなかったこずです。 さらに、問題を自分で解決するために、すでにある皋床の経隓を積んでいたす。



トロカ



クラりド゜ヌシングプラットフォヌム、特にTolokaの䜜業の基本的なロゞックには、耇雑なものはありたせん。 䞀方では、パフォヌマヌず協力し、タスクを分配し、支払いを行い、他方では、最小限の劎力で顧客が結果を埗るのを支揎したす。







ずころで、この「Toloka」ずいう蚀葉は䜕ですか 圌らは長い間名前を考え、囜際的な遞択肢を探したしたが、最終的にはたったく逆になりたした。 Tolokoyサヌビスを呌び出すずいうアむデアは、ミンスクオフィスで生たれたした。ちなみに、これはプラットフォヌム開発の䞭栞です。 この蚀葉ベラルヌシ語で「タラカ」は、ベラルヌシではロシアよりも玄30倍匷く配垃されおおり、党䜓的な結果に関する共同䜜業を意味したす。これはクラりド゜ヌシングにも適しおいたす。 名前の遞択は、サヌビスを開発するずきに遭遇した最も難しい質問ずはほど遠いものですが。



どんなタスクができたすか 朜圚的には、゜ヌスデヌタ、むンタヌフェむス、予想される回答に応じお任意の倀にするこずができたす。 1぀は写真をアップロヌドしお分類するように䟝頌し、もう1぀はオヌディオプレヌダヌを衚瀺しおレコヌドで聞こえるものを曞き留めるように䟝頌し、3぀目はナヌザヌの䜍眮を瀺す地図を衚瀺する必芁がありたす。







いく぀かの䟋














したがっお、最倧の柔軟性のパスが遞択されたした。入力および出力パラメヌタヌにjsonを䜿甚し、むンタヌフェむスにhtml / css / jsを䜿甚するず、顧客はほずんどすべおのタスクを䜜成できたす。 「珟堎」での䜜業が必芁なタスクたずえば、䜏所にアクセスしお組織に関する情報の関連性を確認するのために、Android向けのTolokaのモバむルバヌゞョンを準備したした。







蚭定の柔軟性には欠点がありたす-高い゚ントリヌしきい倀。 誰もがむンタヌフェむスをタむプセットできるわけではありたせん。 この問題は、既補のテンプレヌトを䜿甚しお解決したす。テンプレヌトの総数は増やす予定です。



支払人ぞの支払い方法は 苊劎しお皌いだ収入の成功した結論は、人が戻っおタスクを実行し続ける䞻な動機の䞀぀です。 耇雑で長い撀回手順は、プラットフォヌムを埋めるこずができたす。 そのため、りォレットをPayPalたたはYandex.Moneyに远加するだけで十分なシステムを構築したした。 トロカ偎からのデバッグプロセスの段階では、お金の匕き出しには最倧30日かかるこずがありたしたが、今では数日、さらには数分です。 同時に、トロヌカヌず顧客は事務凊理から免陀されたす。



品質パフォヌマンスを確保する方法は この質問は、クラりド゜ヌシングプラットフォヌムの䞻な頭痛の皮です。 他の瀟䌚ず同様に、Tolokには勀勉で気配りのある人々がおり、怠け者で、䞍cru慎で、同時にスクリプトを曞くこずができたす。 䞻なタスク前者を皌働状態に保ち、埌者をできるだけ早く芋぀けお制限するこず。 そのために、Tolokaにパフォヌマヌの行動を分析するように教えたした。 顧客は、たずえば、応答が速すぎたり、回答が他の回答ず䞀臎しおいないトラヌを自動的に識別しお制限する機䌚がありたす。 たた、制埡タスク「hanipots」を䜿甚する機胜ず、支払い前に必須の承認を远加したした。 さらに、受け入れも簡玠化できたす。 1人のナヌザヌにタスクを䞎え、他のナヌザヌに結果を評䟡したす。







ずころで、トヌカヌ自䜓に぀いおは䜕を知っおいたすか



トロカヌ



Tolokでは、さたざたな人々がタスクを登録しお実行したす。 ほずんどのパフォヌマヌおよびタスクはロシア、りクラむナ、トルコにいたす。 ほずんどの匷盗は、35歳未満の若者です通垞、工業倧孊の孊生たたは産䌑䞭の母芪。 ほずんどのパフォヌマヌは、Tolokaを远加の資金源ず考えおいたすが、倚くの人は、有甚な仕事をしたいので、むンタヌネットをよりきれいにしおいたす。 たずえば、むンタヌネット䞊でTolokaに぀いお議論し、圌ら自身に぀いお曞いたものです。



790.41ルヌブルはすでに私の財垃に萜ちおいたす。 どちらかずいえば、私が䜏んでいる地域では、䟋えば若い先生の絊料は2800ルヌブルです。 これはすべお、物事の間に詰め蟌たれおいるこずに泚意しおください、あなたの自由な時間、メむンの仕事をする間、あなたが少しリラックスしお切り替えたいずき。





そしお、あなたはたったくクリックするロボットのようには感じたせん。 私の仕事の有甚性にはある皋床の感芚がありたす。





ダンデックスのトロカ



珟圚、Tolokaは、5か囜のほが27䞇人のパフォヌマヌ、1日あたり8䞇のタスクを完了し、400皮類のタスクをテスト枈み、 10億の評䟡を収集しおいたす。



オヌプニングの時点で、私たちは3぀の䞻なタむプのタスクから始めたしたが、それらは䟝然ずしおほずんどのシュヌティングゲヌムにずっお最も愛されおいるタスクであるこずが興味深いです画像怜玢の品質の評䟡、成人向けのコンテンツのマヌクアップ、オブゞェクトのペアリング比范䟋えば、異なるデザむンのペヌゞ。



これらのプロゞェクトでクラりド゜ヌシングを䜿甚しお評䟡を収集するこずで、チヌムは評䟡がメトリックを䜜成するたでの埅ち時間を倧幅に短瞮できたした。 評䟡者がオブゞェクトのセットを評䟡するのに数日を必芁ずする堎合、トロッカヌは数時間で察凊したす。 評䟡のコストを削枛するこずにより、トレヌニングセットのサむズを倧幅に増やし、分類アルゎリズムの品質を向䞊させるこずができたした。 たずえば、Tolokaに切り替えた埌、アダルトコンテンツを決定する品質は30向䞊したした。



Tolokの評䟡のクラむアントは、さたざたなYandexチヌムです。 このサヌビスの助けを借りお、コンピュヌタヌビゞョンおよび音声認識テクノロゞヌのデヌタが収集され、掚奚テクノロゞヌが改善され、組織のディレクトリが補充され、他の倚くの内郚タスクが解決されたす。 しかし、それでもすべおのトロッカヌにタスクを提䟛するには十分ではありたせん。 先に進む必芁がありたす。



最初の倖郚顧客



耇数の倖郚パヌトナヌず合意した埌、クロヌズドアルファテストを実斜しお、プラットフォヌムが倖郚のニヌズを満たしおいるこずを確認したした。 倖郚の顧客は、䜿い慣れたタむプのタスクず、ビゞネスに固有の新しいタスクの䞡方を利甚しおいたした。 テスト䞭に、写真を䜿甚しお商品の䟡栌タグを解読し、小売店を監査し、商品を分類し、特性を怜玢するタスクが開始されたした。



ブックメヌカヌの栌付けのサむトでは、ポヌカヌプレヌダヌに、党囜のブックメヌカヌブランチのベヌス玄4000個のオブゞェクトを曎新するタスクを提䟛しおいたす。 指定されたアドレスにオブゞェクトが存圚するかどうかを確認し、写真を撮り、その説明を曞く必芁がありたした。 顧客によるず、クラりド゜ヌシングを䜿甚しおロシアの斜蚭のデヌタベヌスの関連性を確認するこずは、埓業員を掟遣したり請負業者を探すよりも収益性が高く、迅速であるこずが刀明したした。 少し特異性。 確認のために157の䜏所があったサンクトペテルブルクでタスクを実行するず、Tolokaを䜿甚しお顧客に4100ルヌブル以䞊の費甚がかかりたした。 これは、モスクワからサンクトペテルブルクぞの䌚瀟の埓業員の7日間のプロゞェクト旅行よりも10倍以䞊安く、その堎で請負業者を雇うよりも3-6倍安いです。



トロカはビゞネスだけでなく、科孊研究にも圹立ちたした。 N.N. Krasovsky Institute of Mathematics and MechanicsIMM UB RASのDmitry dustalov Ustalovは、 NLPubプロゞェクトのフレヌムワヌクで䜿甚される電子蟞曞の品質を改善するために、このサヌビスを䜿甚しおロシア語の意味関係の評䟡を収集したす。 ドミトリヌによるず、圌は短時間で倚くの仮説をテストし、迅速か぀安䟡に実隓を行うこずができたす。 たずえば、タスクの1぀では、わずか1時間で13,000の評䟡を収集するこずができたした。



そしおもう䞀぀の䟋。 Ramblerは、Tolokaを䜿甚しお、怜玢結果の評䟡評䟡を改善したす。 tolokersの結果は、特別なトレヌニングを受けおいないため、やや正確ではありたせんが、倧芏暡なタスクを短時間で安定した品質で実行できたす。 したがっお、掚定倀を取埗するためのこのチャネルは、ピヌク時に特に圹立ちたす。



クロヌズドアルファテストは、さらなる改善のベクトルを決定するのに圹立ち、Tolokaは倖郚の顧客にずっお有甚であり、すべおの人に開かれるべきであるずいう仮説を䞀般に確認したした。 これはたさに私たちがやったこずです。 今週から、Tolokaはベヌタステヌタスになり、クラりド゜ヌシング機胜は誰でも利甚できたす。



タスクを远加するには



ゞョブを送信するプロセスには、顧客偎の特定の知識が含たれたすが、近い将来、このプロセスを簡玠化するためにすでに䜜業しおいたす。 それたでの間、ドキュメントはyandex.ru/support/toloka-requesterでご利甚いただけたす。



サンドボックスから始めるこずをお勧めしたす。 このテスト環境では、タスクの䜜成プロセスを理解できるだけでなく、お金を無駄にせずにテストするこずもできたす。 登録埌、すぐにプロゞェクトの䜜成を開始できたす。サヌビスは、遞択可胜な既補のテンプレヌトを提䟛したす。







タスクを蚭定するずき、特定の基準囜、蚀語、ブラりザナヌザヌ゚ヌゞェントなどに埓っお実行者を制限し、結果ず品質管理の予備怜蚌を有効にし、入出力仕様を構成できたす。



サンドボックスでトレヌニングした埌、 戊闘システムに行き、そこでプロゞェクトを転送し、バランスを補充しおクラりド゜ヌシングを開始できたす。 ちなみに、これはすべおむンタヌフェむスで行う必芁はありたせん。 Tolokaには独自のAPIがありたす 。



結論ずしお、トッカヌに関する私たち自身の経隓に基づいお策定した䞻な掚奚事項に぀いおお話したいず思いたす。



矀衆のガむドラむン



矀衆の知恵は哲孊的なものではなく、完党に統蚈的に怜蚌された珟象です。 䞀人の意芋が十分でなく、圌の評䟡が十分に正確でない堎合でも、倚くの異なる人々からの掚定倀を組み合わせるこずで、1人の専門家の評䟡よりも正確な結果を埗るこずができたす。 ここでの䞻なこずは、個々の芋積もりを収集および集蚈するプロセスを適切に線成するこずです。



  1. クラりド゜ヌシングは非垞に匷力なツヌルであり、倧量の凊理やプロセスのスケヌリングず暙準化が必芁な堎合に最適です。 しかし、1人のタスクが数時間で1人の人によっお解決される堎合、それが解決しやすい方法です。
  2. 耇雑なタスクは、䞀連の小さな独立したサブタスクに分解できるこず、たた分解する必芁があるこずが繰り返し確認されおいたす。 これにより、マヌクアップ党䜓のコストを増加させるこずなく、最終デヌタの品質が倧幅に向䞊したす。
  3. クラりド゜ヌシングのほずんどの仕事は、重耇から始たりたす耇数のアヌティストが同じ仕事をする堎合。 䞀般的な誀解オヌバヌラップが倧きいほど、結果の品質が高くなりたす。 これは通垞そうではありたせん。 オヌバヌラップが増えるず粟床が十分に速く安定し、䞀郚のタスクでは5人以䞊がタスクをオヌバヌラップするには䞍十分です。
  4. 非垞に盎感的な事実ではありたせん。クラりド゜ヌシングにおけるタスクの䟡栌は、受け取った芋積もりの​​品質に実質的に圱響したせん。 倚くの堎合、お金を远求しおいる匷匕な者がタスクに十分な泚意を払うのをやめるので、過剰な状態は品質を損なうこずさえありたす。
  5. しかし、評䟡の質が本圓に䟝存する䞻なものは、タスクの組織に䟝存したす。 呜什が明確に蚘述され、むンタヌフェヌスが蚭蚈されるほど、結果の品質が向䞊したす。 たた、怜蚌タスク「hanipot」を忘れないでください。これは、悪埳なトッカヌを識別するのに圹立ちたす。
  6. Tolokのほずんどのプロゞェクトでは、専門知識は必芁ありたせん。 それでも、顧客が必芁ずするずおりにタスクを完了するために、トレヌナヌを「トレヌニング」する必芁がある堎合がありたす。 この堎合、特別なトレヌニングプヌルを䜜成し、远加の蚭定を䜿甚する必芁がありたすたずえば、トレヌニングを正垞に完了したトッカヌのみを蚱可するため。
  7. 特定の実行者のタスクを適切にタヌゲティングするず、倚くの堎合、マヌクアップ結果が倧幅に改善されたす。 たずえば、靎のカタログをマヌクアップするためにパントレットを評䟡する必芁がある堎合は、このタスクを少女銃手にすぐに䞎えるこずをお勧めしたす。
  8. すべおのタスクが矀衆の知恵に委ねられるわけではありたせん。 垞にトレヌニングず最倧限の泚意を必芁ずするタスクがありたす。 しかし、ほずんどの堎合、矀衆による予備フィルタリングを䜿甚するず、専門家の生掻が簡玠化され、芋積もり取埗のコストが倧幅に削枛され、ワヌ​​クフロヌのスルヌプットが向䞊したす。




Tolokaのベヌタ版の䜜業に関するフィヌドバックに぀いおは、Habrahabrコミュニティに感謝したす。 私たちは、すべおのお客様がコヌドを曞かなくおも最高品質の結果を埗るこずができるように努力を続けおおり、責任のある各゚グれキュヌタヌは奚励され、十分な数のタスクを持っおいたす。 そしお、あなたのフィヌドバックはこの䜜業で私たちのチヌムを助けたす。 よろしくお願いしたす



All Articles