データサイエンスウィーク2016。1日目と2日目の概要

こんにちは、こんにちは! Data Science Week 2016の最初の2日間のレビューを公開します。このレビューでは、スピーカーが顧客関係と内部最適化について話しました。



画像



1日目



Data Science Week 2016の初日は、顧客関係でビッグデータを使用することに専念しました。 使用された特定のアルゴリズムと技術はほとんど言及されていませんでした;得られた結果とビジネスでのそれらのアプリケーションの方向に重点が置かれました。



ほぼすべてのスピーカーが、推奨システムのトピックに触れました。どのメディアコンテンツ、どのような住宅のレンタルオプション、どの広告をユーザーに提供するかなどです。 また、ビッグデータを使用して顧客を引き付け、保持し、効果的かつ透明な形で顧客と連携し、顧客サービスの品質を向上させることについても話し合いました。 また、市場で入手可能なオファーの集約と検証、ビッグチャネルを使用したマーケティングチャネルの有効性の分析についても話しました。



この日に発表された企業は、ユーザーに関する多くのデータを収集し、ユーザーからビジネス価値を分析して抽出します。



メディア業界では、何よりもまず、コンテンツを消費するユーザーの歴史があります。人々は毎日音楽を聴いたり、記事や本を読んだり、映画やビデオを見たりするため、そのようなデータがたくさんあります。 登録時にユーザーが指定した情報は、ユーザーがソーシャルネットワークを介して承認された場合にも使用され、ユーザーに関する情報もそこから取得されます。 これらのデータ基づいてE-Contentaはさまざまな問題を解決します。 これはパーソナライズされたエンゲージメント(リソース全体を宣伝する代わりに興味深いコンテンツを提供する)、デバイスを共有するとき(たとえば、家族が1台のテレビを持っているとき)に個々のユーザーのプロファイルを強調し、トレンドコンテンツを推奨し、クライアントを保持し、新しいコンテンツに(たとえば、1つのシリーズから別の)、リマーケティング(「疲れた」または無関心なユーザーに新しい興味深いコンテンツを提供する)、作成される将来のコンテンツと他のほとんどのコンテンツを推奨する estno。



画像



不動産市場では、ユーザーがトランザクションを行うことはほとんどないため、 HomeAppは、一定期間のレンタル広告のユーザーの閲覧履歴に関する情報のみを収集します。 この情報、および収集された発表のデータベースおよび価格監視の結果は、視覚化され、特定のオファーを顧客に推奨するために従業員によって使用されます。 同社は専門家の手法を幅広く活用していますが、自動推奨はまだ構築されていません。 主な重点は、オファーのデータベースの準備です。賃貸アパートのデータは、ソーシャルネットワーク、広告掲載用ウェブサイト、代理店やさまざまなアグリゲーター(CIAN、Avitoなど)のウェブサイトから収集されます。 次に、データ分析方法は重複を排除し、顧客を引き付けるためだけに使用される不正な広告を除外し、広告で指定された情報を検証します。 その結果、すでに他の証券会社の収益性指数を超えることができ、ブローカーあたりの業界平均取引数は2倍になり、契約を締結した顧客の割合は4倍になりました。



RockStatは、デジタルマーケティングチャネルの有効性の分析に取り組んでおり、リソースへの特定の訪問が目的の効果をもたらしたかどうかを判断し、視聴を購入などに変換しました。 これを行うために、次のデータが収集および分析されます:ページビュー、ページで発生したイベント、アクティビティ(マウスの動き、スクロール、フォーカスの変更)、httpリクエストを介したサードパーティサービスのデータ、サイトへの訪問者からの呼び出しに関するデータ、およびサイトに残されたアプリケーションCRMシステムデータ(どのアピールが販売につながったかを正確に理解するため)。 これらのデータからセッションが構築されます。ユーザーがサイトにアクセスした場所、ユーザーがいる場所、ログインしたデバイスからユーザーがチェーンで収集し、「ノイズ」を取り除き、チェーン内の各セッションの値を計算します。



DCAは、予想外のデータソースを使用することを提案しています。アイコンの色など、ユーザーの電話にインストールされているアプリケーションに関する情報です。 実際、広告プラットフォームはユーザーに関する十分な情報を提供しておらず、これは利用可能なオープンソースの1つです。 インストールされているアプリケーション(広告が表示されるアプリケーション)の範囲によって、ユーザーの性別と好みを予測できます。 アプリケーションの視聴者を評価するために、Playマーケットで書かれたレビューが使用されます(たとえば、識字率、脅迫、一般的な意見の表現、子供の年齢、名前-性別で判断できます)、Google Playの同様のアプリケーションの推奨事項。 また、ジオロケーションデータを使用してタイムゾーンを決定し、ジオターゲティングされたオファーを生成します(たとえば、クライアントの近くのレストランから食べ物を注文します)。



したがって、データサイエンスウィークの初日は、ビッグデータ分析によって特定のユーザーに提供するものとチャネルを理解し、信頼できる透明なオファーデータベースを作成し、顧客サービスの品質、顧客満足度、忠誠心を改善し、それによって効率を高めることができる例をいくつか示しましたビジネス。



2日目



データサイエンスウィークの2日目は、企業の内部プロセスの最適化に専念しました。 スピーチの一部はデータを使用した作業の最適化に専念し、別の部分はビッグデータを使用した内部プロセスの最適化に、1つのプレゼンテーションはクライアントとクライアントに提供されたサービスの作業品質の改善に専念し、ほとんどの場合は初日に関連していました。



GlowByteを代表する最初のスピーカーであるAndrei Kotovは、企業内のデータを扱う文化について話しました。 彼が参加しなければならなかった多くのビッグデータプロジェクトでは、クライアントは質の高いデータを提供する準備ができていませんでした。 典型的なデータの問題:重複、エラー、矛盾、情報の欠如または冗長性に加えて、レポートは、データ記録の統一された標準の欠如、記録されたデータと客観的に必要なカテゴリーの不整合の問題も強調しました。 たとえば、ファッション業界の企業の1つでは、ファッションデザイナー、店主、その他の参加者によって、服の色と種類が非常に主観的かつさまざまな方法で固定され、食品小売店のチューリップは、最初の新鮮さの野菜と同じカテゴリに割り当てられたため、推奨をすることが難しくなりました。 講演者によると、企業では、従業員が価値を理解し、正確かつ明確にそれらを書き留め、関連情報を維持しようとするように、データを扱う文化を植え付ける必要があります。 これは市場全体を助け、通常のアナリストやビッグデータ企業の仕事を促進します。



画像



マイクロソフトの Vadim Chelyshkovは、機器の状態を監視して信頼性を高め、個人的な目的にも使用するさまざまなセンサーからのデータの使用について話しました。 モノのインターネットを通じて、センサーは大量のリアルタイムデータをサーバーに送信します。 そのようなデータの分析に基づいて、可能性のある故障の日付とタイプを予測するシステム、特に石油生産プラットフォームのエレベーターとポンプを開発しました。 このデータを個人的な目的で使用する例として、スピーカーはロシアの会社Raxel Telematicsの製品を引用しました。これにより、整頓されたドライバーのステータスを確認し、自動車センサーのデータに基づいて数か月間保険の価格を引き下げることができます。



QIWIのDmitry Garmashev氏は、Kiwi Walletサービスのクライアント間の送金グラフの分析について話しました。ベルギーのルーベン大学で開発されたアルゴリズムを使用して、サービスクライアントのコミュニティへの迅速な内訳を確立し、その中の個人の役割を特定することができました。 たとえば、チートコードの売り手と買い手が際立っていたオンラインゲームの1つのユーザーコミュニティを特定することができました。 それらを1つのプラットフォームに結合することで、トランザクションの数を増やすことができました。 詐欺を検出するために、メッセージの内容とウォレットの有効期間についても分析が行われました。 グラフを操作するために、スピーカーはPython NetworkXライブラリと、視覚化ツールGephiおよびD3を推奨しました。



Rambler&CoのPavel Klemenkovのスピーチは、Apache Sparkに基づいた社内のビッグデータの処理と分析の最適化に専念しました。 彼は、データの収集と視覚化、プロシージャの実行作業、特に実行の成功と時間、エラーの原因について話しました。 スピーカーは、実験をデータと生産コードで分離し、大量のデータで実行する前にすべての操作のテストを作成し、「機能のショーケース」を開発する経験を共有しました-トレーニングセットのデータを迅速に選択し、責任者を呼び出す能力に関する新たな問題に関するタイムリーなアラートのシステムを作成する手段。 説明されたシステムを会社に実装した結果、実験の数と速度が増加し、簡単で便利なテスト、デバッグ、コードの実装が可能になり、操作の信頼性が向上し、エラーの原因を理解し、排除することが容易になりました。 同社はKafkaシステムを単一のデータバスとして使用し、Graphiteはすべての段階の監視に使用され、AirFlowは視覚化に使用されました。



最後に、プライベート英語レッスンを専門とするSkyEngのAlexander Laryanovskyは、顧客関係の構築とレッスンのコンテンツの最適化におけるデータの使用について話しました。 たとえば、多くの行動特性に応じて、クライアントがクラスをやめるかどうかと、いくら支払うかを予測できることがわかりました。 初期のクラスを好む「ヒバリ」は、教師を探しているときに彼のために要件を策定した人々のように、よりやる気があることが判明しました。 レッスンの内容は、ソーシャルネットワーク上のプロファイルのデータに基づいて、クライアントの興味に沿ったものになり、試用レッスン後のコンバージョンが20%増加しました。 学生から収集された統計に基づいて、教育方法を最適化することができました。ほとんどの学生が対処する不必要な運動を削除し、最も興味深く、生産的なトピックと作業形態を残します。



»すべてのプレゼンテーションはこちらから入手できます。



»ビデオスピーチへのアクセスは、 ここから入手できます。



All Articles