5月27日、次のモスクワデータサイエンスMeetupがMail.Ru Groupのオフィスで開催されました。 会議には、ロシアの大企業や科学機関の代表者、機械学習の分野の愛好家、ソーシャルグラフや関連分野を分析するための推奨システムが集まりました。 ゲストは、データ分析の実際的な問題を解決した経験を互いに共有しました。 会議で発表された3つのレポートのビデオ録画とプレゼンテーションに注目します。
Dmitry Nosov、Rambler&Co、SparkのH2O:ソーダを飲み、ほとんど窒息した
H2Oは、興味深い有望な機械学習プラットフォームです。 アナリストは、大量のデータの処理速度、一連のアルゴリズム、複数のプログラミング言語のAPIの利用可能性、そしてもちろん、構築されたモデルに関する美しく詳細なレポートをアナリストに提供できます。 H2OはJavaで記述されているため、
TMはSparkクラスターを含むあらゆる場所で機能します。 レポートでは、スピーカーはSparkとYARNでH2Oを使用した経験と、すべての肯定的な品質にもかかわらず、実稼働環境でH2Oを使用しない理由を共有しました。
スピーチのビデオ:
it.mail.ru/video/724
Pasper Filonov、Kaspersky Lab、時系列予測におけるディープラーニングと特徴抽出
深いネットワークを構築するときに行われる機能の自動選択は、データ準備作業の量を大幅に削減できる有望なツールと見なされています。 このレポートは、時系列の値を予測するタスクを考慮し、手動の特徴抽出と生データの完全自動処理に基づいた特徴抽出の両方を使用して、ソリューションに対するアプローチを比較します。
スピーチのビデオ:
it.mail.ru/video/723
アレクサンダーダイアコノフ、VMKモスクワ州立大学、検索結果の関連性問題の解決(Kaggleプラットフォーム上)
昨年の「kaggle HELLの実践ワークショップ」で解決された検索結果の関連性を判断するタスクが分析されます。 テキスト、辞書、アルゴリズムのアンサンブルを分析する複雑な方法を使用せず、それにもかかわらず1300人以上の参加者の中でトップ10に入ることができる非常に単純なアルゴリズムが説明されました。
スピーチのビデオ:
it.mail.ru/video/722
現時点では、
ML Boot Campプラットフォームで開催されている機械学習コンテストが開催されています。 登録してください。コンテスト終了までに2週間以上が残っています。希望する人は簡単にTOPに侵入する時間があるでしょう! :)