Apache Spark Mitap

画像






4月27日、Apache Sparkとの共同作業に特化した最初のmitapがRAMBLER&Co atticで開催されます。



Apache Sparkは、ビッグデータを扱うための主要なフレームワークの1つとして既に確立されており、Amazon、Baidu、IBM、Databricks、NASA JPL、トリップアドバイザーなどの大企業で使用されています。 ロシアでは、Sparkが多くの中小企業や一部の大企業で使用されており、非常に効果的であることを知っています。



Rambler&Coでは、ETLと機械学習に関連する広告テクノロジー部門のほぼすべてのタスクにほぼ1年間Sparkを使用しています。 さらに、年の初めにバージョン2.1.0へのアップグレードに成功しました。



会議では、Sparkを運用環境に導入した経験を共有し、発生した問題について話し、適用したソリューションについて話し合いたいと思います。 Spark 2に登場した新しいクールな機能と、以前のバージョンから正常に移行されたバグを確認してくださいもちろん、この素晴らしいツールの他の愛好家や実践者と知り合い、イベントを定期的に開催してください。 さあ、それは面白いでしょう!



レポートのテーマ:



1.パベルクレメンコフ(機械学習責任者)

Apache Sparkの機械学習パイプライン

Sparkの前に私たちは何を持っていましたか、どのようにしてそれに到達し、数学者やプログラマーは何をしましたか?



2. Konstantin Kolokolov(数学者プログラマー)およびVladimir Shtanko(数学者プログラマー)

PySparkでプログラムする方法は?

フレームワークのアーキテクチャの簡単な紹介。 何が間違っているのか、どこを見て、どのように戦うのか? 足元で自分を撃つ方法は?



3.ドミトリー・ノソフ(数学者プログラマー)

Criteo 1TBベンチマーク

CriteoデータセットでVowpal Wabbit、XGBoost、Spark MLをテストします



4. Shorin Alexander(開発者開発エンジニア)

スパークからの分

Sparkが私たちと共に生きる方法、私たちが彼と共に生きる方法、操作の歴史、サポート、および水中レーキとの戦い。



18.30でのゲストのコレクション。

最初のレポートは19.00から始まります。



登録: rambler-co-e-org.timepad.ru/event/470664

ブロードキャストリンク: www.facebook.com/afishamansarda



All Articles