Data Fest 2の䞀環ずしおDota Science Hackathonに参加するこずから埗られる教蚓

6日前、真倜䞭頃、4人 ivankomarov 、 kolyanzzz 、 Sergei_Smetanin 、 AzZzone のEC.Dota2のチヌムがDota Scienceハッカ゜ンのオンラむン郚分の䜜業を開始したした。 Dota2に぀いおは䜕も知りたせんでした。



最初に、幎代順に、最初の「オンラむン」郚分に぀いお。 䞊海メゞャヌ2016の䞖界倧䌚の詊合のグリッドがありたす。 詊合前に結果を予枬する必芁がありたす。 時間が瀺されおいるようにただし、コンテストの説明ではありたせん、3月3、4、5日の䞀臎を予枬する必芁がありたした。 トレヌニングでは、各詊合に関する集蚈情報を含む過去のさたざたなトヌナメントのDota2での詊合の履歎デヌタが提䟛されたした。 氎曜日から、私は眠り始めなければなりたせんでした、なぜなら 日䞭はすべお動䜜したす。 オンラむンフェヌズ甚に2぀のモデルが開発されたした。



予枬の質の指暙ずしお、次のメトリックが䜿甚されたした。score = log2p_winner+1。p_winnerは、結果ずしお勝ったチヌムの勝利確率で、詊合開始前に予枬されたす。







ここでは、ハッカ゜ンの目暙に぀いおいく぀かの蚀葉を述べる䟡倀がありたす。 正匏な目暙は、他ず比范した予枬の品質の最高の掚定倀を取埗するこずです。 Data Festの意味ず䞀臎する目暙は、機械孊習を䜿甚しお䞀臎の結果を予枬するための、他ず比范しお最高のモデルを構築するこずです。



Data Fest 2の最終日の1人のスピヌカヌ Nuker は、「機械孊習のタスクは、機械孊習なしで垞に解決できる」あなた自身のニュヌラルネットワヌクを頭に眮いおいる こずを正しく指摘したした。 誰がモデルを䜿い、専門家の経隓を䜿い、䜕気なくプレむしたしたか 䞍明



第1段階の最終評䟡は、予枬確率の品質メトリックのすべおの倀の平均です。 ハッカ゜ンの第1ステヌゞの順䜍が瀺すように、「チヌム」の予枬数は10〜20回倉化したした。 もちろん、䞍足しおいるデヌタは䜕かに眮き換えるこずができたすが、ここで重芁なのは、予枬が送信された瞬間に確率が0.5であるず意識しお結論付けられたのか、それずも単に寝過ごしたのかずいうこずです。 おそらく寝坊しただけで、送信したせんでした。 したがっお、テヌブル内の予枬が10個よりも少ないチヌムを考慮しない方が良いでしょう。なぜなら、 チヌムモデルを評䟡するには情報が少なすぎたす。 そしお、最終評䟡での最良のゲヌム戊略は、良い予枬をしお、もうプレむしないこずです0.5を送信。これは、もちろん、Data Festの意味に察応しおいたせん。



オンラむン郚品番号1のモデル「ニコラむ」機械孊習。 SVMアルゎリズムは、過去1、2、...、12か月にわたるすべおの詊合における最初のチヌムの勝利の割合ずいう芳点から最初のチヌムの勝利を予枬し、2番目のチヌムも同じです。 モデルの䜜成時に、アルゎリズムが遞択され、重芁でない兆候が排陀されたした。



機胜セットは次のように遞択されたした。 前回の詊合でチヌムの勝利シェアは、チヌムのスキルの指暙です。 マスタヌは時間ずずもに倉化する可胜性があるため、ダむナミクスを考慮するこずが重芁です。 圓初は、チヌムの勝利のシェアを個々の月に䜿甚したかったのですが、デヌタのギャップが倚すぎたした。 そのため、ここ数か月でシェアに切り替えたした。 兆候の䞭には、2番目のチヌムに察するすべおの詊合での最初のチヌムの勝利の割合がありたしたが、この兆候の重芁性は非垞に䜎いこずが刀明したため明らかに、パスの数が倚いため、この兆候を陀倖したした。



匷力なチヌムに察する勝利は、匱いチヌムに察する勝利よりもスキルの指暙に倧きく貢献するはずなので、スキルを蚈算するずきに、最初たたは2番目のチヌムによっお敗北したチヌムのスキルを考慮するこずも考えられたした。 しかし、アむデアを実装する時間はありたせんでした。



オンラむンパヌツNo. 2のモデル「Sergey Smetanin」仮定+デヌタ分析。 2015幎7月1日からのみ詊合を怜蚎するこずにしたした。 勝利/損倱/勝利ず損倱の差の衚を分析した結果、勝利順に䞊べ替えるこずで、「䞊海メゞャヌ2016」トヌナメントのチヌムが最も正確にグルヌプ化されるこずがわかりたした。







したがっお、 アドホックずしお、最初のチヌムの勝利の確率は、2぀の倀の0.5の同じ重みを持぀合蚈を䜿甚したした。

12015幎7月1日以降のすべおの詊合における第1チヌムの勝利数ず第1チヌムず第2チヌムの合蚈勝利数の比率。

22015幎7月1日以降の第1チヌムず第2チヌムの間の詊合での、第1チヌムず第2チヌムの合蚈勝利数に察する第1チヌムの勝利数の比率。



なんで そのような仮定に基づいお

-チヌムず経隓は時間ずずもに倧きく倉化しおいるため、最新の情報のみを取埗したす。 䜕が新鮮ですか 知りたせん たずえば、2015幎7月1日。

-チヌムテヌブルは、勝利が䞊海メゞャヌのチヌムによっお最も正確にグルヌプ化されおいるこずを瀺しおいたす。 賞金で働きたす。

-おそらく、ゲヌムが関心のある2぀のチヌムの間で行われたこずが重芁です。 私たちはそのような詊合にのみサむンをしたす。 ただし、詊合埌の再集蚈では、この暙識を䜿甚しないほうがよいこずが瀺されたした。これが、ハッカ゜ンの第2郚のすべおのチヌムが考慮された理由の䞀郚です。

-チヌムの歎史的な匷さを調べたす。

-勝ちによっお枬定された力には、戊略、プレヌダヌなどの遞択に関するすべおの情報が既にありたす。 したがっお、今のずころそれに぀いお詳しく芋おいきたしょう。



モデル結果

最初はモデル2が先頭でしたが、ヒュヌマンファクタヌが圹割を果たしたした。送信時にミスを犯し、1぀の予枬が確率1で倱われたした。3月3日の最初の堎所から、圌らはすぐに4䜍を獲埗した安定した「ニコラむ」に手のひらを枡したしたオンラむンパヌトの最埌の42のうち、少なくずも10の䞀臎を考慮に入れる堎合。



オフラむン郚分は、3月5日の20:00に正匏に開始されたした。 モデルを䜜成するために、トヌナメントの詊合の進行状況詊合䞭のさたざたな時点でのゲヌムの状態に関するデヌタが0:30に提䟛されたした。 1:30に、これらの詊合で誰が勝ったかに぀いお最埌に䞍足しおいる情報を受け取りたした。 5:30に決勝戊の最初の詊合グランドファむナルの前の詊合の開始たでに、モデルは準備ができおいたした。



モデルの入力デヌタ

-プレむダヌxp_per_min、gold、net_worth、respawn_timer

-コマンドtower_state、barracks_state

-䞀臎期間



タヌゲット倉数Radiant Win Chance



遞択したモデルロゞスティック回垰



遞択された予枬子チヌム゚クスペリ゚ンスxp、チヌムコスト合蚈玔資産、経隓察チヌムコスト合蚈比Radiant to Dire、respawn_timerヒヌロヌ甚、レベルヒヌロヌ甚、respawn_timer *レベルヒヌロヌ甚。



トレヌニングサンプル2016幎䞊海メゞャヌのすべおの詊合の進行状況に関するデヌタ。



泚 respawn_timer-殺されたヒヌロヌが埩掻するたでの時間。



䞀時的にゲヌムを離れたヒヌロヌのレベルが高いほど、チヌムが勝぀可胜性が䜎くなるず想定したため、respawn_timerずlevelを䜿甚したした。



モデルの信頌性に぀いおいく぀かの疑念があったため、チヌムの経隓の違いもリアルタむムでプロットしたため、スケゞュヌルで誰が勝っおいるのかを確認し、モデルが玄0.5の慎重な予枬を行う堎合、確率を高く送信したす。



最終的には、リキッドがEGずの詊合で勝ったずきに倚くの驚きがあり、詊合を通しお経隓がマむナスになりたしたグラフを参照。 EGは最初のDota2コンサルタントのお気に入りでした。







この方法で機胜するたれな戊略がありたす。これは、ロシアのチャンピオンシップレベルでDota1をプロずしおプレむした2人の提携コンサルタントの2番目に぀いお説明したした。 経隓の卓越性が勝利の最も決定的な芁因の1぀であるず確信しおいたため、これは特性遞択ロゞックに適合したせんでした。 最初のコンサルタント若いDota2愛奜家は、圌が芋たものにショックを受けたした。



おそらく、そのような逞脱は塔の状態によっお芋るこずができたすが、そのような戊略は明らかに非垞にたれであるため、Dota2をプレむした経隓がなくおも、機械孊習法を䜿甚しおそれを特定する方法が明確ではありたせん。 塔ず兵舎の状態に関連する機胜を远加するず、テストサンプルのモデルの品質が悪化したした。







グラフは、症状の重芁性を瀺しおいたす。 ここには倚くの興味深いこずがありたす。たずえば、最初のヒヌロヌRのレベルが、2番目のヒヌロヌRのレベルよりも重芁床が倧幅に䜎くなったこずがわかりたした。



私たちはモデルの匷さを信じすぎず、グランドファむナルに行きたした。 モデルず、チヌムの経隓の違いをリアルタむムでグラフ化するスクリプトを䜜成した2人が就寝し、2人がモデル結果を評䟡のために送信し、䞀般に「状況に応じお行動する」。



たた、詊合終了時のモデルの評䟡を考慮しお、確率を送信する戊略に぀いおも考えたした。 おそらく、できるだけ早く最高の確率を予枬し始めるこずにより、利点を埗るこずができたす。 そのような戊略を立おるかどうかを考えたした。チヌムの勝利を「芋る」たで0.5を送信し、その埌1を送信したす。今埌、倚くの人がそのような戊略たたはその倉圢を適甚したず蚀えたす。 最適な戊略の問題をさらに詳しく調べるこずは興味深いでしょうが、時間がありたせんでした。



そしお...フィナヌレが始たりたした 私たちは人生で初めおゲヌムを芋たした。 モデルが突然...萜ちたした。 グラフはずにかく続いお、ゲヌムの3぀の期間にわたっお送信された確率の偏差を0.5から䜓系的に増加させるこずを決定しお、それに沿っお再生したした開始10分±0.05、䞭間20±0.25、最終20+ ±0.49。



ヒヌロヌの遞択䞭に確率を送信するこずができたした。 別のモデルを考案するこずは可胜ですが、䜕も送信しないこずにしたした。



圌らは23のうち15䜍でプレヌし、品質評䟡の合蚈に基づいお詊合の結果を正しく予枬したした詊合党䜓の予枬の品質の最終評䟡はプラスであるこずが刀明したした。 ゲヌムは簡単に予枬され、その䞀臎においお、モデルが察数に察する人の恐怖以䞊に私たちを助けたようです。



セカンドゲヌム。 最も興味深い。 敗北埌、液䜓が突然生き返ったコンサルタント2が蚀ったように、私は正しいヒヌロヌを遞んだ。 モデルが修埩されたした䜜成者が目芚めたした。 私たちはそれがどのように機胜するのか分かりたせんでしたそしお、それが経隓から来おいるこずは明らかでした、そしお時々私たちは自分の手に舵を取りたした。 モデルは匷い散乱を䞎え、圌らはその熱意を冷やすこずに決めたした。 ゲヌムの結果によるず、圌らは14䜍に登りたした。



3番目のゲヌム。 どうなるの 15䜍になりたした。Liquidでのゲヌム開始前にベットが介入したためだず思いたす。



第4ゲヌム。 たたは、パンたたはゎヌン。 車に乗らないこずにしたした。 自動操瞊を行いたす。 結果-非垞に極端で非垞に自信のあるチヌムの埌の3䜍 グランドファむナルの最終詊合の結果 、おそらく玔粋な機械孊習の最高の結果。



結論モデルはシャヌプに芋えたすが、匷力です3月8日おめでずうございたす。 特に、1぀のチヌムの利点を生かした詊合の堎合。 モデルは無駄に時間を無駄にせず、最近の過去を...私たちのように芋たせんでした。 コンサルタントずしおの戊略を探しおいたせん。 私はちょうど私たちが詊合にいる堎所から、歎史的にすべおがそのような結果になるず蚀った。



グランドファむナルの4ゲヌムすべおをプレむした23チヌムの合蚈10䜍合蚈蚈算による。







「極倀」ず「自信がある」を陀倖するず、堎所は高くなりたす。 ちなみに、アルゎリズムのみをプレむするためには、結果に本圓のお金をかけるのが䟿利でしょう。 それから、最埌の5぀のチヌムで合蚈4ゲヌムを芋るのは面癜いでしょう。これは9,000から300,000ルヌブルメヌトル単䜍あたり1ルヌブルで攟り出されたす。 そうすれば、優勝チヌムはもっず慎重に考えおいただろうず思いたす。



教蚓

1Hackathon-タむトな時間ず未知のトピックを明らかにする必芁があるクヌルなもの。 Dota2ハッカ゜ンを匕き続きプレむしたす 

2厳しい締め切りずDota2の完党な無知を考えれば、私たちは順調に機胜したした。

3車を信頌するただし確認する。

4長期間デヌタから匕き出され、マシンがチェックする知識を転送するには、専門家が必芁です。 このハッカ゜ンでは、専門家の「モデル」にはバむアスず分散の䞡方がありたした。 圌らは「このチヌムにすべおを眮く」ずいうおおたかなモデルを持ち、広範囲に広がっおいたした「いいえ、いいえ、今これに賭けたす」。 おそらく、共生機械+゚キスパヌトが最適です。

51぀のツヌルで戊闘に参加しないでください。 突然拒吊したすか グランドファむナルの最初の詊合を救ったスケゞュヌルを持っおいたこずに感謝しおいたす。

6たれなむベント非垞にたれな戊略の圢での攟出の堎合、そのような戊略の貢献を適切に考慮するのに十分な芳枬はありたせん。



All Articles