怒っているのはいつですか-朝、午後、または夕方ですか? 「失敗した」50〜70スタートアップへの投資を早期に削減したことによるSkolkovoの損失を削減できましたか? どこに住む? あなたは他の確率的に不確実な質問とタスクを尋ねることができます-私たち一人一人がそのような百万を持っています。 多くの場合、ビッグデータテクノロジーにより、...いいえ、解決策ではなく、問題全体に対する適切なアプローチが可能になり、デミウルジの高さから見て、適切な問題を提起し、実用的な解決策のより最適な方法を構築できます。
第1シリーズのコメントで、 ServPonomarevは、ビッグデータから新しいメタ知識を取得する場合について興味深い質問をしました。 さらに少し進むことをお勧めします。新しいテクノロジーは、新しい知識を獲得できるだけでなく、半ば、新しい知識で環境に影響を与えることができます。
まず、1つの質問に答えてください。「 ソーシャルネットワークでは、ポジティブよりネガティブな回数は 2回ですか?2、5、10回ですか?それともすべて同じですか?」 私たちは皆、ソーシャルネットワークが否定性の本当の汚点であることを知っています、人類のfall落の深さをチェックすることは残っています。 しかし、実用的なタスクの「科学者」または「技術部門」の形でのみ助成すれば、そのようなナンセンスに従事する余裕があります。
VK、FB、Twitter、OK、Instagram、およびその他の非FourSqureタイプのソーシャルネットワークで「メッセージ」をジオロケーションするタスクは、非自明なソリューションと大規模な世界テストを必要とする深刻な商業ニーズの1つです。 もちろん、優秀な幹部は、どんな費用でも「太る」ようにします。 数年前、ブランド分析の責任者であるナタリヤ・ソコロバは、新しい強力なジオモジュールをテストするための実用的なアプリケーションのアイデアを思い付きました。これが、人気のある定期的な研究「ロシア地域の愛と憎しみ」が生まれた方法です。ガバナーはレポートで使用します。 2014年から2015年の冬の期間の最新の研究-br-analytics.ru/blog/lubov-i-nenavist-na-karte-rossii
調査のためのデータ -3500万人のロシア人著者からの12月の2週間の5億通以上のメッセージ。 この研究の結果は氷山の一角であり、分析精神とメンデレーエフ症候群の人は、他のデータと比較することで、多くの追加の興味深い情報を独立して「掘り起こす」ことができます。 たとえば、ソーシャルメディアデータアグリゲーター-pl.ilook.ru/statisticsの公開オンライン統計から特定のソーシャルネットワーク上のデータ量を評価する場合 。 シリーズの1つでソーシャルメディアデータ集約技術のユニークな機能についてお話しします。これは巨大で興味深い技術市場です-AppleがTwitterからTopSyを2億ドルで「盗んだ」、Twitterは報復としてgnipを購入せざるを得なかったDataSiftでマーケティングの洞察を行います。
「愛と憎しみ」に戻る:最初の質問に何百人もの知人に尋ねる(「ポジティブよりネガティブなのは何回ですか?」)彼らは一度だけ「よりポジティブだろう」という答えを聞いた。 この調査は、ロシアのソーシャルネットワークのソーシャルネットワークのユーザーの声明におけるポジティブは、平均で4倍多いことを示しています!
シリーズの最後の2つの側面:
1. 1か月半前、人類全体のポジティブなムードに関する「科学者」言語学者の研究が公開されました: www.pnas.org/content/112/8/2389.full-研究自体、結果のロシア語の解釈-lenta.ru/news/2015 / 02/10 /正
このような研究には、本格的な方法論と言語研究が必要です。 ブランド分析は、「愛と憎しみ」の研究を半年ごとのモードで公開しています。これは、社会の変化が緩やかであり、研究のための高い頻度が必要ないためです。 変化する状況とトレンドの急上昇(チェリャビンスクmet石など)を監視するには、速度が必要です。 構造化されていないビッグデータ(言語、調性、NER、地理参照)を処理するための適切な技術があるため、調査の準備に1〜2日のビッグデータアナリストしか必要ありません。これについては後で詳しく説明します。
2.私たちの意見では、 最も重要で予想外の結果 :続く各6か月の研究は、ロシアのソーシャルネットワークにおける積極性の増加を示しています! 肯定的なフィードバックが作成されました:数百万人-数十億のメッセージ-ビッグデータテクノロジー-研究-ソーシャルメディア(メディア、フォーラム、ソーシャルネットワーク)での数千の出版物-数万のコメント、議論、宣誓何百万人もの人々の間でポジティブな...男-群れの生き物でした:-)
第2シリーズの簡単な要約:ビッグデータはデータレイクですが、おいしい魚を捕まえるには、いくつかの初期情報が必要です。正しい質問:なぜ湖の隣にいたのですか? なぜ魚が必要なのですか? どの色、サイズ、どの深さから魚が必要ですか? そうすれば、答えは半分になります。釣り竿が必要なのか、回転竿が必要なのか、シンカーまたはフロートが必要なのか、ボートが必要なのか、「海岸から」のようなものです。 いってらっしゃい!
次のシリーズでは、ビッグデータアナリストについて明確に説明します。まず、同僚は常にそれらを探しています(一方、BD分析はスキルよりも芸術であり、自分自身と呼ぶ何百人もの人々は自分自身と「システム」を十分に分離していないか、よりリラックスして作業することに慣れていますモード(秒-分-時間ではなく、週-月-四半期);次に、最初のシリーズの後、5つのリクエストにビッグデータ分析に関する質問がありました-そして、私たちは興味のあるシグナルを追跡しようとします。
エピソード1:ビッグデータ-夢のように
シリーズ3:オバマボタン