機械学習ブートキャンプIV。 4番目。 シークレット あなたの

画像







4月21日に、ML Boot Campプラットフォームで4回目の機械学習コンテストを開催します。 今日は、新しいタスク、サイトの更新、その他の便利なニシュティクについてお話します。 そして、ML Boot Campとは何かを初めて聞いた場合は、ネタバレの下に行ってください。







ML Boot Campについて

ML Boot Campは、機械学習タスクを解決するためのプラットフォームです。 定期的に新しいタスクを投稿し、コンテストを開始します。 参加者は1か月以内に問題を解決し、解決策を送信する必要があります。 最適なソリューションの作成者には賞品が贈られます。 前回のチャンピオンシップでは、MacBook Airが1位、iPadが2位と3位、iPod nanoが4-6位になりました。







開始時に、参加者はタスクの条件、利用可能なデータの言葉による説明、トレーニングサンプルを受け取ります。 このサンプルは、ラベルの付いた例(既知の回答を持つ各オブジェクトの説明ベクトル)で構成されています。 参加者は、コンピューター学習のためのコンピューター既知の方法を使用してコンピューターをトレーニングします。 彼らは新しいオブジェクト(テストサンプル)で訓練されたシステムを使用し、それらの答えを決定しようとします。







テストサンプルは、評価と最終の2つの部分にランダムに分割されます。 評価データの全体的な結果はシステムによって計算され、すぐに公開されますが、最終データで最高の結果を得るのは勝者です。 結果は、コンテストの最後まで参加者に隠されたままです。







選手権の最終日に、参加者は決勝で自分を代表する2つの決定を選択できます。 それらのベストはリーダーボードにカウントされます。







新しい挑戦



今回は「秘密のタスク」を提供します。 問題の意味のある声明は公開しません。 彼女は、競技会の終わりまで不明のままです。 分析スキルを完全にテストすることができます!







分類の課題に直面しています。5つのクラスの教育要素のよく知られた分布に基づいて、テスト要素を配布します。 応答として、各行がテストデータを含むファイル内の行に対応し、クラス番号(0、1、2、3、または4)を含むテキストファイルを送信します。 分類用に42個もの数値記号を提供しています!







ソリューションの品質の基準は、正しく分類されたオブジェクトの割合です。 テストサンプルは、40/60の比率でランダムに2つの部分に分割されます。 最初の40%の結果により、コンテスト全体の評価表における参加者の位置が決まります。 残りの60%の結果は、競技終了後に知らされ、参加者の最終的な配置を決定します。 頑張って







UNNに感謝します。 N. I.ロバチェフスキーと個人的にニコライ・ゾロティクとオレグ・デュランディンは、チャンピオンシップのタスクと専門家のサポートを準備してくれました! ニコライとオレグは、MLチャンピオンシップのそれぞれの開催に参加しました。彼らがいなければ、今までの半分をマスターできなかったでしょう。







便利な資料



教育記事



初心者の場合は、プラットフォームの小さなチュートリアルを読むことをお勧めします。 その中で、「クレジットスコアリング」タスクを分析し、クライアントに応じてローンが銀行に返還されるかどうかを予測する方法を学習します。







画像

この記事には、圧縮されたテストデータ、その視覚化、Pythonコードの断片、およびすべてのセマンティックな結論が含まれています。







ML BootCamp Iの解析



ML Boot Campでは、すでに匿名データを使用していました。 非公開の学生コンテストで、バイナリシーケンスの分類を依頼しました。 正解の割合も品質基準でした。 Pavel Shvechikovは印象的な0.6785を達成しました。ただし、一部のシーケンスは人によって作成され、2番目は乱数ジェネレーター、3番目はアルゴリズムです。







コンテストの受賞者にソリューションの主なアイデアを伝えるように依頼し、それらをHabréの別の出版物に集めました 。 おそらく彼らのアイデアは、あなたが移動の方向を選択するのに役立つでしょう。 見てください、そこにはクールな視覚化があります:







画像

すべてを視覚化できます。 偶数のバイナリシーケンス







サンドボックス



サンドボックスの 「バイナリツリー」タスクを含め、チャンピオンシップの開始前に練習できます。 過去のチャンピオンシップのタスクはすべてそこで利用できます。ソリューションをダウンロードしてスコアを確認できます。 各タスクについて、サンドボックスには独自のリーダーボードがあります。 新しいタスクが難しすぎる(または逆に単純な)ように思える場合は、残りを征服してください。







画像

サンドボックスでは、古いコンテストのすべてのタスクを解決できます







電報でチャット



さて、 チャンピオンシップの公式チャットのおかげで、主催者に直接質問をすることができます。 また、アドバイスを求めたり、決定についての推測を共有することもできます。 すべての参加者がここに集まり、タスクを急襲します。 あなたは新鮮なアイデアと親切な言葉で助けられます。







画像

過去のコンテストの勝者を含む、経験豊富な機械オペレーターがチャットに参加します。







フォーラム



参加者は、チャットで簡単に失われる可能性のある何かを出すためのフォーラムを非常にリクエストしました。 コンテストの開始直前にオープンすることはできませんが、近い将来フォーラムがサイトに表示されることをお約束できます。







答えとしての2つのソリューション



これからは、最終的な解決策として2つのソリューションを選択できます。 最終サンプルで最高のスコアを獲得したものが、チャンピオンシップの結果になります。 これは、たとえば、ソリューションの1つでより安定したモデルがあり、テストサンプルで他のソリューションが最良の結果をもたらす場合に役立ちます。







賞品



今回は、賞金プールのApple機器の細長いランクを破ります。 1位にはMacBook Air 13ラップトップ、2位と3位にはスマートウォッチSamsung Gear S3 Frontierを贈ります。 トップ3に入らないが、TOP-6に入ると、 WD My Cloud 6TBクラウドドライブがあなたと友達になります。 そして、いつものように、チャンピオンシップのトップ50参加者には、チャンピオンシップのロゴが入ったTシャツが贈られます。







登録



選手権は4月21日14:00モスクワ時間に始まります。 このリンクでプラットフォームに登録できます。 運動が始まるまで、 サンドボックスで問題を解決してください。








All Articles