先ほど繰り返し報告したように、今年JUG.ruグループ会社は将来を検討し、
なぜビッグデータと機械学習の会議を開催するのですか? 集めざるを得ないからです。 そして、できるだけ多くの開発者を友だちに変えるために、私たちは伝統的に最初のカンファレンスホールから無料のオンライン放送を開きます。
そのため、SmartData 2017のメインホールからの無料オンラインブロードキャストは、2017年10月21日午前9時30分(モスクワ時間)に開始されます。 あなただけ、私たちと未来。 今回は、ブロードキャストが2kで利用可能になります-4kモニターを入手してください!
SmartData 2017カンファレンスの最初のトラックのオンラインブロードキャストへのリンクとレポートの簡単な説明は省略中です。
オンライン放送を見る
メインホールで行われる会議の最初のトラックには、次のものがあります。
- Vitaliy Khudobakhshov-名前は機能です
- Mikhail Kamalov-レコメンダーシステム:行列分解からラインモードでの深層学習まで
- Sergey Nikolenko-物体検出と画像セグメンテーションのための深い畳み込みネットワーク
- Dmitry Bugaychenko-クリックから予測、およびその逆:Odnoklassnikiのデータサイエンスパイプライン
- Artem Marinov-毎日リアルタイムで6億人のユーザーをセグメント化
- Alexander Krasheninnikov-Hadoopの高可用性:Badooエクスペリエンス
- Ivan Yamshchikov-Neurona:なぜニューラルネットワークに、Kurt Cobainのスタイルで詩を書くように教えたのですか?
報告の合間に、サイトのスピーカーと参加者がディスカッションゾーンの見栄えの良いガラスを後にすると、会議の非セッションイベントに関するオンラインブロードキャストの視聴者を表示し、スピーカーと興味深いゲストからの刺激的なインタビューを受けます。 インタビュー中に質問がある場合は、 Telegram-chatカンファレンスで質問を書いてください。 JPointでの表示は次のとおりです。
ファーストトラックプログラム
9:30-10:30 //オープニング、JUG.ruグループチームとのインタビュー、会議の主催者とパートナーからの開会の挨拶。
10:30-11:20 Vitaliy Khudobakhshov-名前は機能です
教育を受けた人にとってそれがどんなに奇妙に見えても、孤独である/孤独である確率は名前に「依存」します。 私たちは愛と関係について、あるいはむしろ、ソーシャルネットワークのデータがこれについて正確に何を伝えることができるかについて話します。 「名前がセリョーザの場合、車に衝突する可能性は、コスティアと呼ばれる場合よりも高い!」と言っているのとほぼ同じです。 まあ、少なくとも非科学的です。 したがって、ソーシャルネットワークのデータ分析を使用して行うことができる最も予想外で直感に反する観測について説明します。 もちろん、このような観測の統計的有意性、ボットの影響、誤った相関の問題を無視しません。
11:40-12:30 Mikhail Kamalov-推奨システム:行列分解からラインモードでの深層学習まで
現在、推奨システムは、エンターテイメントの分野(YouTube、Netflix)とインターネットマーケティングの分野(Amazon、Aliexpress)の両方で積極的に使用されています。 この点に関して、レポートでは、推奨システムのアプローチとして、深層学習、コラボレーションおよびコンテンツのフィルタリングと時間によるフィルタリングの使用の実際的な側面を検討します。 さらに、ハイブリッド推奨システムの構築と、Sparkでのオンライン学習のアプローチの変更も検討されます。
12:50-13:40 Sergey Nikolenko-オブジェクト検出と画像セグメンテーションのためのディープコンボリューションネットワーク
畳み込みニューラルネットワークは、長い間、画像処理のモデルの主要なクラスになりました。 レポートでは、個々のオブジェクトを認識するネットワークが、オブジェクトを他のホストと区別するネットワークにどのように変化するかについて説明します。 有名なYoLo、シングルショット検出器、R-CNNから最近登場したMask R-CNNまでの一連のモデルについて説明します。
14:25-15:15 Dmitry Bugaychenko-クリックから予測へ、およびその逆:Odnoklassnikiのデータサイエンスパイプライン
機械学習は楽しいですが、産業で機能するためには、退屈なことをたくさんしなければなりません。 このレポートでは、機械学習がゴールドフレームのダイヤモンドのように輝くために必要なすべての技術、アルゴリズム、および方法を検討します。
例として、1つの困難なタスク、ニュースフィードのパーソナライズを検討します。 機械学習の詳細に入ることなく、データ収集(バッチおよびリアルタイム)、ETL、およびモデルを取得するために必要な処理について説明します。
ただし、モデルを取得するだけでは不十分なため、複雑で負荷の高い分散環境でモデルベースの予測を取得する方法と、意思決定にそれらを使用する方法についても説明します。
このレポートでは、Hadoopエコシステムのデータ処理およびストレージテクノロジーなどについて説明します。 このレポートは、娯楽だけでなく利益のためにも、機械学習に従事している人々に役立ちます。
15:35-16:25 Artem Marinov-毎日リアルタイムで6億人のユーザーをセグメント化
ユーザーは毎日、何百万ものオンラインアクティビティを実行しています。 FACETz DMPプロジェクトは、このデータを構造化し、セグメント化してユーザー設定を識別する必要があります。 KafkaとHBaseを使用した方法を説明します。
•MapReduceからRealtimeに切り替えた後、6億人のユーザーをセグメント化しました。
•毎日50億のイベントを処理します。
•ストリーム処理中のセグメント内の一意のユーザー数に関する統計を保存します。
•セグメンテーションパラメーターの変更の影響を監視します。
16:45-17:35アレクサンダークラシェニンニコフ-Hadoopの高可用性:Badooエクスペリエンス
Hadoopインフラストラクチャは、分散ストレージやデータ処理などのタスクの一般的なソリューションです。 優れた拡張性と開発されたエコシステム賄briにより、Hadoopにさまざまな情報システムのインフラストラクチャーにおける強固な場所を提供します。 ただし、このコンポーネントにより多くの責任が割り当てられるほど、フォールトトレランスと高可用性を確保することが重要になります。 レポートでは、Hadoopクラスターのコンポーネントの高可用性の確保について説明します。 さらに、話しましょう:
•対処している「動物園」について。
•高可用性を提供する理由:システム障害のポイントと障害の結果。
•このために存在するツールとソリューションについて。
•実装の実際の経験について:準備、展開、検証。
このレポートは、Hadoopを既に使用している(知識を深めるため)場合に最も役立ちます。 このレポートは、このソフトウェアパッケージで使用されるアーキテクチャソリューションのレビューという点で、聴衆の別の部分にとって興味深いものになります。
17:50-18:40 Ivan Yamshchikov-Neurona:なぜニューラルネットワークにカートコバーンのスタイルで詩を書くように教えたのですか?
2017年、「人工知能」はあらゆる鉄から聞かれるフレーズです。 ビジネスにおける機械学習と人工ニューラルネットワークの適用例は数多くありますが、このレポートではAIの創造的な機能について説明します。 Neurona 、 Neural Defense 、 Pianolaをどのように使用したかを説明します 。 創造的なAIを構築する際の現在の課題について説明し、これがなぜ重要で興味深いのかについて説明します。
私たちの発表を要約するために、人気映画からの引用を思い出しましょう。「地球上の生命は謎です。 しかし、そのコンポーネントは技術的な問題です。」
今すぐ参加しよう!
制限事項
- 放送は現状に基づいて提供されます。すべてがうまくいくと確信していますが、突然何かが起こったとしても、私を責めないでください!
- ビデオ録画 。 ほとんどすぐに利用できるようになりますが、フィードバックを残した会議参加者のみが利用できます。 そして、他の皆のために、私たちは伝統的に会議のYouTubeチャンネルに3〜4か月でそれらを投稿します。
- 他の部屋で何が起こるか見ることはできません。 そして、 多くの興味深いことがあります。 次回はチケットを購入して、制限なしですべてを見てください。