![](https://habrastorage.org/files/95d/e46/453/95de46453bac40e08b6c42b26baf590d.jpg)
こんにちはHabr
そこで、 モスクワ博物館で新しいSMITテクノロジーの展示会でデータフェスティバルを開催しました 。
これは、ビジネス、科学、行政のさまざまな分野から専門家を集め、データ分析について話すシリーズの最初のイベントです。
狭い範囲の企業と人々の特権であったデータの保存と分析は、ほとんどすべての人々の生活に影響を与え始めています。 このため、この一連のイベントを開始し、幅広い聴衆にデータとその分析について説明しました。
だから、フェスティバルで何があった:
![](https://habrastorage.org/files/442/f8e/6a3/442f8e6a3ca9481bb80158ccea6fee61.jpg)
最初、Andrey Ustyuzhanin(YandexおよびCERNとの共同プロジェクトの責任者)は、機械学習がBlack Matterの研究にどのように役立つかを説明しました。
![](https://habrastorage.org/files/a01/8a1/077/a018a1077a9f42c88086522cf470f7ff.jpg)
さらに、Alexey VorobyovとKirill Krasnoshchekov( 国家統一企業「モスクワのNIとPIの一般計画」 )は、都市計画のためのビッグデータの使用について話しました。
![](https://habrastorage.org/files/4af/046/9c9/4af0469c9f804c65b59895ae108ff6b6.jpg)
Natalia Kalaitanova( DCA Media Expert)は、分析を使用してメディアプレースメントへのアプローチを変更することについて話しました。
![](https://habrastorage.org/files/c23/646/268/c236462683804f328031e0d11a861cc4.jpg)
Avita Nikita Kotlyarovが、機械学習を使用してAvitoの不正な広告をブロックすることについて語っています。
![](https://habrastorage.org/files/8c0/719/72e/8c071972e6f14d6086702fe7a47db563.jpg)
Beeline School of DataのYuri Kashnitskyは、古典的な規範に適さないパラメーターの観点から非常に成功したPlayboyモデルを特定する例により、データの放出を分析することの重要性について語りました。
![](https://habrastorage.org/files/69c/f13/241/69cf13241d1f4c02b7a297ae88944528.jpg)
Rostislav Yavorsky(HSEコンピュータサイエンス学部、データ分析および人工知能部准教授)は、ソーシャルネットワークの分析について話しました。
![](https://habrastorage.org/files/00a/78c/673/00a78c673e9a47f9bcc78aca3d1d726e.jpg)
Beeline Big Data DepartmentのSergey MarinとBeeline Data Schoolの創設者は、Big Dataを使用して各クライアントのレベルでパーソナライズされたクライアントエクスペリエンスを作成することについて話しました。
![](https://habrastorage.org/files/e4c/ca8/efb/e4cca8efb079406fa5e19091e33e77fc.jpg)
すべてのプレゼンテーションは こちらから 入手でき ます 。
また、フェスティバルの一環として、データ分析ハッカソンを実施しました。 ハッカソンのテーマは、加入者間のコミュニケーションを予測することでした。
![](https://habrastorage.org/files/6ff/b1a/948/6ffb1a948a334e0d85d86273d886112d.jpg)
特にハッカソンでは、可能な限り現実に近い合成データを生成し、異なるサブスクライバー間の接続のグラフを記述しました。 グラフの上部は100万を超えていました。
その後、このデータについて特別なノイズを作成し、一部のリンクを破壊しました。 タスクは、これまで存在しなかった多くの新しいエッジを作成せずに、途中で最大数の接続を復元することでした。
ユーザー間の接続の存在という単純な事実に限らず、ユーザー間の通信のサイズと形式に関する情報も追加しました。
ファイルフィールドの説明:
A-サブスクライバーAのID、
B-サブスクライバーBのID、
x_A-加入者オペレーターAのID、
x_B-加入者オペレーターBのID、
c_AB-AからBへの呼び出しの数、
d_AB-AからBへの通話時間、
c_BA-BからAへの呼び出しの数、
d_BA-BからAへの通話時間、
s_AB-AからBへのSMSの数、
s_BA-BからAへのSMSの数
参加者には、決定フォーマットの構造と内部監査に精通するためのコードも提供されました。
Benchmark.ipynbは、結果を検証するために必要な特別な形式に応答を変換する単純なソリューションの例です。
Checker.ipynb-ソリューションの品質をチェックするコード。
![](https://habrastorage.org/files/d70/440/09c/d7044009cecc48e4bba242a53f792da3.jpg)
ハッカソンの間に、提案されたタスクは以前考えていたよりももっと面白くて複雑であることに気づき、登録した参加者に12月23日水曜日の18:00までの時間を与えて、最初の4時間に制限しないことにしました。 これを行うために、ハッカソンをすぐにオンラインモードに移行しました。
次のオンラインインタラクション形式は次のとおりです。
登録された参加者が次の情報を提供するGoogleフォームのフォームが作成されました。
名前と姓(またはニックネーム)
郵便
レイアウトされたsubmission.csvへの直接リンク
解説-質問の場合
最終的なドキュメントは、主催者だけが見ることができました。
1日1回またはそれ以上の頻度で:
ソリューションをダウンロードし、ソースデータを使用してチェッカーを実行しました
更新された評価と参加者の結果
回答済みの質問
水曜日の午後6時以降、結果をまとめて勝者を決定しました。 彼らは次のようになりました:
1位:アレクサンダーククシキン。 賞品: Beeline Data School証明書
2位:アントン・ウスティノフ。 賞品:クエストチケット
3位:ゲオルギー・ズブリエンコ。 賞品:ヘッドフォン
アレクサンダーは彼の決定の説明をここに投稿した。
すべての人は素晴らしい仲間です! 1月の第1週にモスクワのVimpelComセントラルオフィスですべての賞品を厳soleに発表します。
一般的に、私たちのフェスティバルのすべての参加者に感謝し、イベント自体と組織が楽しいものであるという希望を表明したいと思います。
これはそのようなイベントの最初のイベントであり、来年はさらに多くのイベントを計画しています。 Habréの発表に従い、 学校のページでニュースを購読してください。
今年の上に、そしてパラダイムの継続において、幅広い聴衆のためのデータ分析について話すために、私たちはラジオコムソモルスカヤ・プラウダに出演し、そこでデータ分析、傾向およびデータの学校について話しました。 空気記録はこちらから入手できます 。
近日中の祝日で、新年にお会いしましょう!