ビッグデータウィークモスクワのマージンノート





ビッグデータウィークモスクワからのプレゼンテーションを含む前回の投稿に続き、ロシア人および国際的なスピーカーによるいくつかの声明を収集しました。



私はこれらの言葉を耳で記録したので、可能性のある間違いを事前に許してください。 また、ステートメントの1つが「ボタンアコーディオン」であると思う場合は、コメントで書き留めてください。脚がどこから伸びているかを知るのは興味深いことです。



1. 「サブジェクトエリアの知識は、データサイエンティストの仕事に特に役立ちません」

Yandex Data Factoryのチーフデータサイエンティスト、ミハイルレビン



コンテキスト: Data Factoryは、昨年12月のParis Le Web会議で発表されたセンセーショナルなYandexプロジェクトです。 Yandex Data Factoryは、国際市場向けのスタートアップとして開発中です。 Yandex Data Factoryの開発者は、ビッグデータに基づいて大規模なビジネス指向の製品を作成します。 ロシアのパイロットの中では、例えば、ズベルバンクと呼ばれます。



興味深い理由:従来、データサイエンティストは、対象分野の詳細についての知識が機械学習の使用の成功の最大50%を決定すると主張しています。 そして、ミハイル・レビンは「ブラックボックス」を最前線に置き、特定の値の物理的意味を考慮せずにさまざまなパラメーター間の相関関係を探ります。



2. 「Hadoopエコシステムの進化はLinuxの進化を繰り返します」

ジョセフクルト、データサイエンティスト、IEビジネススクールマドリッド教授



コンテキスト:IE Business Schoolは、世界で最高の20のビジネススクールの1つです。 最近、彼らはビッグデータの修士課程を持ち、この分野の専門知識を集め始めました。 Joseph Curtoは、Delfos Researchのディレクターであり、さまざまなビジネス分野でのデータ分析技術の実装を専門とするデータサイエンティストです。



なぜ興味深いのか:最初はHadoopとLinuxを比較することは予想外ですが、本質的に生産的です。 これは、Hadoop分布の潜在的な範囲の両方を意味し、「Hadoop死」の予測に反論します(たとえば、Hadoop対Sparkのコンテキストで)。 CurtoはHadoopをパラダイムと呼び、このエコシステムは死ではなく、発展を予測しています。 ところで、HadoopとSparkのコントラストは正しくありません。SparkとHadoop Map-Reduceを比較する方が正確です。



3. 「Beelineは、内部の最適化タスクではなく、外部顧客向けのビッグデータの開発に重点を置く戦略的決定を下しました」

Vlekpelcom、リードデータサイエンティスト、Aleksanr Krot



コンテキスト:VimpelCom(Beelineブランドを所有する会社)は、長い間ビッグデータビジネスを開発しており、内部問題の解決に成功しています。 さらに、Vimpelcomには、ビッグデータを扱う2つの部門があります-管理情報部門とデータサイエンス専用の研究所です。 2013年秋、新しいCEOのミハイル・スロボディンがVimpelcomに来ました。その到来により、通信戦略の大きな変化が起こりました。



興味深い理由:Vimpelcomには、ロシアで最も強力なビッグデータチームの1つがあります(大規模なインターネット企業の一部ではありません)。 「従来の」(つまり、インターネットではない)ビジネスについて、ビッグデータは主にコアビジネスから収益を増やすのに役立つことが一般的に受け入れられています。新しい顧客を見つけ、チェックを上げ、セキュリティ問題を解決し、詐欺を阻止します。 Beelineが外部の顧客にサービスを提供することでデータを獲得するという新しい戦略への移行(サブスクライバーへのデータの提供については話していません。これは会社で何度も明確に示されています)。 この決定は、新しいCEOのミハイル・スロボディンの到着に関連しています。 ロシアのテレコム市場は長い間爆発的な成長段階を経ており、現在は年に数パーセントしか成長しておらず、将来的には従来のサービスがより安くなり、利益がますます少なくなるため、ビーラインはビジネス構造を変える機会としてビッグデータに依存しています。



4. 「インターネット広告会社のコンバージョンは、視聴者の心理セグメンテーションを考慮して調整すると、約20%増加する可能性があります」

キリル・チストフ、データ中心アライアンス開発ディレクター



コンテキスト:データ中心アライアンスは、ビッグデータと高負荷システムの使用に特化したロシアの会社です。 同社の開発は、デジタルマーケティングの分野にあります。オンライン広告のプログラムによる購入から、クライアント企業のデータベースとの技術的統合まで。



興味深い理由:インターネットでのユーザーの行動に関するデータがあれば、場所、性別、年齢に基づいて広告キャンペーンをターゲットにできます。 アナリストの仕事がやや複雑になったため、人の意図や好み、つまり読んで見たもの、休んでいた場所、運転している車についても学ぶことができます。 しかし、今日、これは多くのマーケティング担当者にとって十分ではありません。



DCAで、聴衆を心理タイプ(合理的/非合理的、外向的/内向的、不安)で分けることを学びます。 「サイコタイピング」は、機械学習と人的資源の使用を必要とする複雑な分析プロセスです。



ブランドが消費者の性質を理解すると、メッセージの意味だけでなく、プレゼンテーションの形式にも適応できるため、コンバージョンが大幅に増加します。 彼らは実際にDCAのこの事例研究を共有しました。「アンチエイジング化粧品」カテゴリでは、加齢に伴う変化に不安のある女性(「不安な」心理型)をターゲットに、プロモーションサイトへの訪問者の流入が2.5倍増加しましたが、この訪問により、広告主の費用は60%安くなりました。



広告キャンペーンの正確なターゲティングは、現在ますます一般的になっています。 3月、Sberbankは、高度にターゲットを絞った広告ターゲティングに人工知能とビッグデータ処理技術を使用するSegmento広告プラットフォームの開発者であるRuTargetを買収しました。



5. 「ソーシャルネットワークの分析にビッグデータテクノロジーを使用することには、議論の余地のないビジネスアプリケーションがなく、より大きな範囲でR&Dタスクです。」

Alexey Natekin、データマイニングラボディレクター



コンテキスト:Data Mining Labsは、データマイニング、学生教育、デザイン開発、データ分析理論の分野の研究に従事しています。



なぜ興味深いのか:情報のオープンソースを使用できることは、ビッグデータを使用する利点の1つです。 ソーシャルネットワークに関連して、彼らは広告とクレジットスコアリングを最適化するタスクにしばしば言及しますが、これらのケースは外部タスクのソーシャル「機能」により依存しています、とネイトキンは言います。



PSビッグデータウィークモスクワの主催者は、新しい職業研究所とDigital October Centerでした。



All Articles