11月10日(明日)モスクワで、10月のシネマセンターは、SDSJ 2018の受賞者が授与される大きなSberbank Data Science Day会議、データサイエンスの分野における多数の国際的およびロシアの専門家によるスピーチ、MLに関するセクションおよび科学における人工知能の使用をホストしますとビジネス。 そしてもっと面白い!
ここでライブ放送を見ることができます 。 カットの下およびサイトプログラム。 また、Sberbank Data Science Journeyの受賞者の評価方法についても説明します。
プログラム
会議はいくつかのテーマブロックに分かれています。スケジュールは次のとおりです。
メインホール
11:00-11:30。 会議のオープニング。
11:30-12:30。 パネルディスカッション「デジタル経済におけるデータ分析技術と人工知能」
12:30-13:15。 「ディープラーニングにおける生物学的に条件付けられた方法とアーキテクチャ。」 セルゲイ・バルトゥノフ、ディープマインド
13:15-14:00。 「人間の感情を理解し、その感情を表現するためのインテリジェントなデジタルコンパニオンとしての会話エージェント。」 Soo-Young Lee、KAIST
15:00-15:45。 「スケーラブルな自動機械学習。」 アンドレイ・スピリドノフ、H2O
15:45-16:30。 パネルディスカッション「Trending Innovation:Using DS / AI and Improving Customer Experience」
17: 15-18 :00 Sberbank Data Science JourneyおよびClassic AIコンペティションの受賞者に厳wardな賞を授与(人工知能を使用したバーシフィケーションの競争)
ホール「科学」
12 :30-13: 45 .DS / AIテクノロジー:AutoML
13:45-14:45。 DS / AIテクノロジー:コンピュータービジョン
14 :45-15: 45 .DS / AIテクノロジー:自然言語処理(NLP)
15: 45-16: 30 .DS / AIテクノロジー:強化学習
16 :30-17: 15 .DS / AIテクノロジー:音声分析
ホール「ビジネス」(ホール1)
12:30-13:45。 銀行および金融におけるDS / AIアプリケーション
13:45-15:00。 医学およびバイオインフォマティクスにおけるDS / AIの使用
15:00-16:15。銀行および金融セクターでのDS / AIの適用
16 :15-17: 15 .Brainwriting:AI研究のためのプラットフォームの作成
ホール「ビジネス」(ホール2)
12:30-14:45。 小売でのDS / AIの使用
14:45-16:30。 DS / AI産業用アプリケーション
16:30-17:15。 メディアおよび通信におけるDS / AIアプリケーション
コミュニティホール
12:30-13:15。 ポスター発表「ポスターセッションライトニングトーク」
13:15-15:00。 DS / AIの分野におけるオープンプロジェクトのプレゼンテーション「AI Open Projects」
15:00-15:45。 古典的なAI競争の意思決定
15:45-17:15。 Sberbank Data Science Journey競合分析
Sberbank Data Science Journeyの受賞者
今年、AutoMLテクノロジーを使用して問題を解決することを提案しました。 11月3日の終わりまで、参加者は決定をアップロードし、次の12時間で決定からベストを選択しました。 今の選択はju審員です。 会議では、Sberbank Data Science Journeyの受賞者に報いる。
参加者には、Sberbankから既製のデータセットが提供されました。 競争に関与する24のデータセットはすべて、小売部門、リスク部門、テクノロジー部門などのさまざまな部門によって収集されました。 それらはすべて特別に訓練され、非人格化されました。 基礎は次のような情報でした:
- 承認された制限シェア
- カード配達時間
- 異なる種類のスコアリング
- カード提供のフィードバック
- 他の製品オファーへの対応
- ATMの内訳
- ATM現金引き出し情報
- 口座残高およびその他の情報
決定を評価するために、データセットのグループが選択されました:チェック(参加者に公開)、公開(参加者から隠されていますが、競技中に結果を見ることができます)、プライベート(競技の結果が要約されるセット)
このような各セットには、3つの回帰問題と5つのバイナリ分類問題があります。 ソリューションは、1MBおよび300行から1GBおよび1mln行までのさまざまなサイズのデータセットで機能しました。 競争の開始前に、ju審員はデータセットを準備し、テストシステムはすでにそれらを自動モードでチェックしており、サイトで結果を見ることができます (陰謀に関連する制限を考慮に入れて)。
決定は、コードを含むアーカイブの形式で行われました。 参加者は、機械学習の問題を自動的に解決し、入力としてデータを受け取り、出力で即答を返すという完全なサイクルを実装するアルゴリズムを構築する必要がありました。
参加者の決定は、与えられた制限に適合しなければなりませんでした。
- 利用可能なリソース
- ソリューションがインターネットリソースにアクセスできない
- ソリューションを使用したパックおよびアンパックアーカイブの最大サイズ:1 GB
- アーカイブは、ソリューションの書き込みに使用可能なランダムアクセスメモリ(ramfs)にあるファイルシステムに解凍されます。
- コンテナの残りのコンテンツは読み取り専用です
- データセットを含むCSVは3 GBを超えません
- 参加者を同等の技術的条件に置くことにより公平な比較を達成するためには、制限が必要です。
このコンテストの評価システムは次のとおりです。
- 各タスク(データセット)について、タスク固有のメトリック(回帰のRMSE、バイナリ分類のROC-AUC)がサンプルのテスト部分で考慮されます。
- 各タスク(データセット)について、参加者のメトリックは、次のスキームに従って共通のスケールに変換されます。 (送信済みで正常にテストされたすべてのソリューションの中で)最適なメトリックソリューションの場合、1ポイントが与えられ、ベースラインソリューションは0ポイントと推定されます。 最適なソリューションとベースラインソリューションの間のメトリックに参加している参加者には、0〜1の比例ポイントが与えられます。ベースラインの底部の品質の決定は、0ポイントと推定されます。 最適なソリューションとベースラインの決定が同じ場合、すべての参加者は0ポイントを獲得します。 参加者のソリューションがタスクでエラーを出した場合、または制限時間を過ぎていない場合、このタスクに対して0ポイントを獲得します。
- 各参加者の最終結果は、共通スケールへの変換後の各タスクの結果の合計と見なされます。 一般的なリーダーボードでは、参加者は最終結果によってランク付けされます。
コンテストの結果はこちらでご覧いただけます 。
主な分類に加えて、参加者はノミネート「Best Public Decision」で賞を競いました。 競争を通じて、彼らはGitHubでAutoML問題を解決するためのアプローチを発表し、勝者はGItHubの星の数によって決定されました。
会議にはSDSJ'18専用の別のセクションがあり、そこで勝者が決定について話し合い、すべての質問に答えます。
もう一度、会議のオンラインブロードキャストへのリンクを残してください。そうすれば、興味のあるすべての人がSberbank Data Science Dayを見ることができます。