今日、6月15日、チャンピオンシップはML Boot Campプラットフォームで始まり、健康と人類の寿命の問題に捧げられます。 チャンピオンシップは、カザフスタン共和国保健省の共和党e-Healthセンターと協力して、Insilico Medicineと共同で開催されました。 なぜこれが私たちにとってあまり一般的な競争ではないのか-カットの下で。
これは今年で3回目のチャンピオンシップですが、多くの理由から非常に特別なものです。 まず、これは私たちが単独で実施するのではない最初のチャンピオンシップです。このコンテストは、カザフスタン共和国保健省のInsilico MedicineおよびRepublican Center for e-Healthと緊密に連携して開催されます。
第二に、競争のテーマは珍しく、全体として人類の差し迫った問題に非常に近い。 これは薬です。 今回、プログラマは心血管疾患の診断の問題の解決策を模索します。 これはユーラシアでの最初のチャンピオンシップで、参加者は機械学習技術を使用して健康と長寿を保証するソリューションを見つけます。 参加者にとって、これは興味深い問題を解決するだけでなく、人類の一般的な健康などの重要な問題の解決に貢献する非常に良い機会であると思われます。 誰が知っているか、多分私たちは今、診断と治療の全く新しい手段の起源にいます。 そしてそれは素晴らしいことです!
第三に、データセット。 医療機関で細心の注意を払って収集されたログはなく、最もリアルな臨床データです。 匿名化された10万件の臨床検査。 さらに、問題を解決するメカニズムは、チャンピオンシップで通常行うこととは少し異なります(「タスク」セクションを参照)。
第四に、賞。 私たちの定期的な参加者はすでに確立されたスキーム「トップ6賞+ 50お土産」を知っています。 しかし、これについては少し驚きがあります。
残りの期間は、チャンピオンシップは通常どおり開催されます。2017年6月15日から7月15日までの1か月以内に、参加者は1つの問題を解決しなければなりません。
課題「CVDの存在」
競争の一環として、参加者は古典的な健康診断の結果に基づいて心血管疾患の存在を予測する必要があります。 データセットは100,000の実際の臨床テストから形成され、3つのグループに分類できるサインを使用します。
客観的な兆候:
- 年齢
- 成長
- 重さ
- 性別
測定結果:
- 血圧の上限と下限
- コレステロール
- グルコース
自覚症状:
- 喫煙
- 飲酒
- 身体活動
年齢は日数で示されます。 コレステロールとグルコースの値は、3つのクラスのいずれかで表示されます:正常、正常よりも高い、正常よりも著しく高い 主観的属性の値はバイナリです。
すべてのインジケータは検査時に与えられます。 今少し珍しい。
記号の最後のグループには明確な解釈はなく、さらに患者自身の言葉から収集されます。 したがって、テストサンプルのデータの一部については、これらのパラメーターを明確に除外しました。 参加者は、場合によっては自分で予測するか、無視する必要があります。
データは、70/10/20の比率で分割されます。 トレーニングサンプルは7万件の結果で構成され、さらに1万件は競技中に参加者が利用できる公開指標と見なされます。 残りの2万人は、最終的な勝者を決定するためのメトリックの計算である隠されたテストサンプルに進みました。
バイナリ分類を扱っているため、メトリックは対数損失関数です。
賞品
今回の6つの賞の分配は次のようになります。
Top1:MacBook Pro
Top2:NVIDIA 1080ti
Top3:NVIDIA 1060
Top4-5-6:WD My Cloud 6 TB
伝統的に、50人の最高の参加者には、チャンピオンシップのシンボルが入ったTシャツが贈られます。
主催者にとって最も興味深い決定を下した参加者には、Mail.Ru Group、Insilico Medicine、カザフスタン共和国保健省とのインターンシップまたはコラボレーションの機会が与えられます。 さらに、ju審員からの特別賞は、カザフスタン共和国の保健大臣との個人的な会合のためのアスタナへの旅行です。
コミュニティMLBootCamp
新しい競争のたびに、Telegramのコミュニティは成長しています。 専門家は経験を共有し、初心者は学びます。 ドアはすべてに開かれているので、参加してください。
登録
チャンピオンシップは今日、モスクワ時間の18:00に始まります。 こちらから登録してください 。 頑張って!