データサイエンスウィークエンドレビュー

みなさんこんにちは! 3月3〜4日に、データサイエンスウィークエンドが開催されました。これは、 GVAの支援を受けて、当社によって3回目の開催となりました。 イベントに参加しなかった人のために、何が起こっているかについて簡単な概要を用意しました。



画像



イベントは2つのテーマの日で構成されていました。 1日目は人工知能とディープラーニングに専念し、2日目はビッグデータの実践とビジネスの問題に専念しました。



初日には5回の公演が予定されていましたが、不可抗力がありました。最初のスピーカーが病気になり、私たちと話すことができませんでした。 それにもかかわらず、私たちは聴衆との興味深い相互作用を準備し、次のスピーカーのために少し暖めました。



1.インタラクティブは「それはフィクションですか、それともフィクションですか」という精神に基づいていました。 そして、人工知能の達成についてのいくつかの文言が続きました。 たとえば、「AIはユーザーリクエストのみを使用してフォトリアリスティックな写真を生成することを学んだのは本当ですか?」 使用シナリオは、「火山の写真を見せて」です。 そして、ニューラルネットワークはいくつかのクールな画像を生成します。

地区17にはそのような質問がありました。そして、私たちの参加者は大多数を問題なく対処しました。 結局のところ、聴衆はかなり準備ができていました。



2.このインタラクションの後、Intento CEOのKonstantin Savenkovが話しました。 レポートは、現在の世界でさまざまなサービスを統合する問題に当てられました。 各サービスには独自のAPIがありますが、一方から他方に切り替えるのはかなり困難です。 この問題を解決するために、Intentoはさまざまなサービスを相互に統合できる製品を用意しました。 Konstantin氏によると、現時点では、人工知能の分野でのAPIサービス(機械翻訳、画像認識、テキストから音声への翻訳など)に注力しています。



3.次の講演者は、アナトリーヴォストリヤコフでした。セグメントの対話システムとスマートアシスタントの指揮者(!)です。 Anatolyは、カスタマーサポートの分野でチャットボットに存在する問題にかなりの注意を払いました。 人々は、対話中に目標を変更したり、非線形に質問したり、特定の問題を解決した過去の歴史を参照したり、何百もの異なる方法で同じ要求を作成したりする傾向があります。チャットボットを構築する古典的なアプローチは、これらの問題に常に対処できるとは限りません。 プレゼンテーションの最後に、ニューラルネットワークに基づく別のアプローチ、いわゆるエンドツーエンドが提案されました。これは、開発者が厳密なルールを規定せず、ネットワーク自体が利用可能なデータから知識を抽出できるようにするものです。



4.次は、1C-BitrixのAlexander Serbulによるプレゼンテーションでした。 アレクサンダーは自分自身に忠実であり、彼の明るく感情的な方法でニューラルネットワークを訓練した経験について話しました。 1C-Bitrixには、ウィンドウの1つからさまざまなソーシャルネットワークやチャネルの顧客と通信できる「オープンライン」機能があります。 ある時点で、人々はしばしば同じ質問を思い付くことが明らかになり、それらに答えるためのオプションを提案するボットを作るというアイデアが浮上しました。 この経験については、アレキサンダーの話でした。



5.この日の最後のパフォーマンスは、RBCによると2016年の投資家であるニコライ・ダビドフとのサンフランシスコからの電話会議でした。 プリズマはアップステージで今年のアプリになり、MSQRDはFacebookに売却されました。 これらは、ニコライがやらなければならなかったプロジェクトです。 彼のプレゼンテーションは、この分野のビジネスに焦点を当てていました。 彼は、現在起こっていることは本当に革命であり、数年後には人工知能が多くの産業で使用されると言った。 同時に、ニコラスは、現時点ではほとんどのプロジェクトがエンターテイメントと消費者のトピックにあると不満を漏らしました。 この点で、アドバイスが与えられました-産業にプロジェクトを実装するために行ってみてください。 ニコライは、農業、医学、遺伝学などの分野からいくつかの例を挙げました。また、彼は、対象分野のAIアルゴリズムの人と、これらのアルゴリズムを知っている人に対象分野の知恵を教えることは同じように難しいことを指摘しました。さまざまな分野の専門家から、有能に管理します。



画像



イベントの2日目に、8つの公演が計画されました。



1.最初のスピーカーは、OSAハイブリッドプラットフォームプロジェクトのメンバーでした。 このプロジェクトの目的は、棚の上の製品の存在を増やすことです。 これを行うために、彼らは次のようなことを予測します。1.予想される商品の需要の増加(たとえば、天候による)。 2.現時点で棚に商品が存在しない確率(たとえば、小切手によるリアルタイム)。 3.将来的には、カメラを使用した製品認識システムの開発が計画されています。



2. 2人目は、イベントの公式パートナーであるMegaFonの同僚です。 分析サービス責任者のAndrey Uvarovは、ビッグデータ分析、機械学習、人工知能のテクノロジーを使用して、MegaFonが具体的なビジネス効果をどのように達成するかについて語りました。 会議の初日のテーマであるチャットボットに続いて、同僚は仮想アシスタントであるエレナに参加者を紹介しました。 音声コマンドを認識するこの技術は、クライアントをコールセンターのオペレーターに接続しなくても、発信者を目的のメニュー項目に転送し、オペレーターサービスの使用方法に関するヒントを提供します。 インフラストラクチャディレクターのAlexander Bashmakov氏は、MegaFonネットワーク開発のスマートな計画のためのデータ分析技術の応用について話しました。 プレゼンテーションは、MegaFonインタラクティブゾーンの全員に初めて実証された、自動監視およびネットワーク管理システムのレビューで終了しました。



3.次はデータサイエンティストのE-Contenta、ユーリマカロフでした。 彼は、ニューラルネットワークを含む多くのアルゴリズムを試し、検索結果からデータのテキストをどのように分類したかについて話しました。 ランダムフォレストアルゴリズムは、ネットワークよりも高速である1つのトリッキーな機能を使用して無効にされました。 次に、トレーニングを受けた分類器を使用して、パーソナライズされたコンテンツの推奨事項を作成します。



4.夕食前の最後の講演は、New Professions Labのデータ教育プログラムマネージャー、Artyom Pichuginからでした。 彼は、データサイエンスを研究する理由、それを正しく行う方法、および現在募集中のプログラムについて簡単に説明しました。 「なぜ?」という質問に答えて、アルテムは現在の傾向と、誇大宣伝の曲線だけが注意を払う価値のある曲線ではなく、たとえば、市場でのイノベーションの広がりの曲線があることについて話しました。 「どのように?」という質問に対して、彼は大人と子供の学習方法について話しました。そのため、異なる学習の価値もあります。その後、彼のプログラムでのアンドラゴジー(成人教育の科学)の使用例をいくつか挙げました。



5.昼食後、最初のスピーカーは、QleanのアナリティクスディレクターであるYevgeny Gaponでした。 彼は、データ収集からモデルの実装まで、プロセスのすべての段階を経て、機械学習が自社でどのように見えるかについて話しました。 Evgenyは、クライアントの清掃拒否を予測する場合に特に注意を払いました。 清掃の突然の拒否はビジネスに有害であるため、このイベントの早期予測のタスクは緊急です。 予測では、柔軟なボーナスシステムを通じてこのイベントを防ぐことができます。顧客が注文をキャンセルする可能性が高いほど、注文を保存するためのボーナスが高く表示されます。



6.プログラムの次のスピーカーは、CleverDATAのデータサイエンティスト、Artem Prosvetovでした。 スピーチのトピックは興味深いものでした。「美容ブログのテキストマイニング:女性は何について話しているのですか?」Artemは、化粧品分野の製品を宣伝する目的で最も影響力のある美容ブロガーを特定するプロセスを示しました。 最も影響力のあるブロガーを特定した後(ちなみに、興味深い事実は、最も人気のあるブロガーがポジティブな色の投稿を書いている、つまりブロガーが特定の製品を賞賛している)、分析はブロガーが通常書いている製品について行われました。 分析の結果は、次のタイプの推奨事項です。シワ防止クリームはブロガーAを介して、オイルはブロガーBを介して促進されます。



7.プログラムの最後から2番目のスピーカーは、ブランド分析分析センターの責任者であるSvetlana Krylovaでした。 彼女は同様の話をした-彼らのプロジェクトは、人々がアレルギーについてソーシャルネットワークで書いているものの分析に関連していた。 分析の結果、アレルギーに苦しむ人のイメージを宣伝することは現実とは異なることが明らかになりました。 広告では、これは彼女の外見を気にする少女ですが、実際には、これらはアレルギーに苦しむ子供の母親です。 また、この分析から、スプラスチンが最も人気のあるアレルギー治療薬である理由が明らかになりましたが、それは初期世代の抗ヒスタミン薬であり、現時点では副作用の少ないより高度な治療法があります。



8.プログラムは、UrbicaのCEO、Andrei Karmatskyによって完了されました。 講演は、データを使用した都市デザインについてでした。 プレゼンテーションには多くの美しい視覚化があり、視聴者の目は喜びました。 アンドレイが語った最も興味深い事例は、モスクワの公共交通路線の再編成に関するプロジェクトでした。 プロジェクトチームは、モスクワの交通システムが現在どのように存在するかを分析し、シミュレーションモデルを構築しました。 その後、ルートの最適化が提案されました。これは実際にテストされ、乗客の増加と、バスとトロリーバスの待ち時間の短縮が示されました。



私たちは、このイベントで話をしてくれたすべての人、そしてこの2日間観客の立場にいたすべての人に感謝の意を表したいと思います。 あなたはホールに素晴らしい活気のある雰囲気を作り出しました。



次のイベントである本格的なデータサイエンスウィークは、9月7、8、11、12日に開催されます。



お待ちしています!



»すべてのプレゼンテーションはこちらから入手できます



»ビデオスピーチへのアクセスは、 ここで入手できます



All Articles