インターネットを使用したイベントの結果を予測する方法、またはチャンピオンズリーグの決勝で誰が勝つか

あなたが知っている最も成功した予測的で将来のイベントツールは何ですか? コーヒーかす? コイントス? または社会的な質問? この記事では、近い将来、最も信頼性の高い予測ツールの1つになる可能性のある、将来のイベントを評価する新しい方法について説明します。



5月28日にウェンブリースタジアムで開催されるチャンピオンズリーグの決勝で、誰がソーシャルメディア、いわゆる「予測市場」で意見を調査する可能性について学びます。



コンドルセの定理から予測市場へ



ほとんどが間違っていないのは本当ですか? そして、人々の声は常に真実であると?

200年以上前、フランスの科学者で政治家でもあったコンドルセMar爵は、ju 審に関する定理の中でこの論争の的となっている質問に答えました。予測的個人の数の増加。



ソーシャルメディアの全盛期と、全員(または1秒ごと)がオンラインで意見を述べる能力により、インターネットは世論調査として統計を収集するための代表的なプラットフォームになりつつあります。 しかし、結果の取得と分析は、はるかに単純で、動的で、比較的安価です。

また、場合によっては、限られたオフラインスペースで検索するよりも、ネットワーク上のテーマサイトで正確に検索する方が簡単な場合があります。



このような情報と意見の倉庫を利用しないことは罪であり、コンドルセの定理に基づいて、新しいクラスのアプリケーションが作成されました- 予測市場(RP) 。 現時点では、すでにそれらの数百があります。 その核となるのは、そのようなアプリケーションは証券取引所などの投機的な市場であり、その参加者は予測でお金を稼ぐことを目標としています。 特定のシナリオでのベットが高いほど、票が高くなります。 そのようなアプリケーションが存在する権利を証明する驚くべき事実の1つを次に示します。

「米国では、ポーランド共和国の予測は、世論調査や専門家の予測よりも正確に、米国での最後の大統領選挙で行われました。 IEE RPのMAPEの誤差は1.5%でしたが、ギャラップポールの誤差は2.4%でした(ギャラップポールは常に最も正確な推定値で有名です)。



オンライン予測の成功は近い



アメリカの会社「General Sentiment」は、実際にブロゴスフィアの声を人為的に作成された交換ではなく、第三者の観察と情報収集を通じて評価し、検証した最初の企業の1つです。



昨年の春、彼女はソーシャルメディアやニュースメディアを監視して、アメリカの人気番組American Idol(スターファクトリーの先駆者)のファイナリストを決定しました。 このリンクですべての調査読むことができます(PDF調査をダウンロードできます)。主なポイントの概要のみを説明します。



彼らの研究では、メディアバリュー、センチメント、ボリュームの3つの指標を使用しています。

Media Valueは、特定の人またはブランドが従来のメディアチャネル(PRイベント、イベント、有料記事、レビューなど)で費やさなければならない量に対応する、人のすべての参照を実際の価値(ドル)に変換します。 。 数字は本当に深刻でした

センチメント -これは議論のトーンであり、特定の著者のセンチメントインデックスに従って計算されます。

ボリュームは、ブランド言及の総数です。



アメリカ人は、テレビ番組の最後の直前に研究を発表しました。2人の応募者、クリスタル・バワーソックスとリー・ディワイズが出てきました。 ただし、Media Valueは7人の参加者について計算されました。最初から、観客はファイナリストのCrystalとLee(日付-2010年4月から5月)よりも他のすべての参加者にあまり注意を払っていません。







2人のファイナリストのセンチメントとボリュームの指標を計算した後、「一般的なセンチメント」のメンバーはクリスタルバウワーソックスを成功に導きました...しかし、最終的にはリーディワイズが勝ちました。

もちろん、予測が実現すれば、事件はよりエレガントになりましたが、これと「一般的な感情」によるその後の多くの研究は、オンライン環境で意見を分析することによって大衆イベントの結果を予測できる時代に近づいています。



しかし、これはすべて西洋の研究ですが、私たちは同様の仕組みを採用し、ロシア語を話すインターネット視聴者に似たものを作成することにしました。 そして、もちろん、彼らは未来を見つめ、ヨーロッパで最も壮大なフットボールトーナメントであるチャンピオンズリーグで誰が勝つのかを知りたくなりませんでした。

私たちは、ほとんどのユーザーが誰の勝利を収めたかを知るために、チャンピオンズリーグ決勝の議論の分析を行い、それに基づいて予測を行いました。



どのように機能しますか?



データ収集は、フォーラムからオンラインメディアまで、さまざまな種類のオンラインメディアで行われました。



調査の過程で、試合の結果についてのほとんどの話は彼ら自身によって決定された主な情報源はフットボールコミュニティとポータルであり、そこではコメントで広範な議論が展開されました: http : //www.eurosport.ru、http : //news.sportbox.ruhttp: //www.championat.ru、http //football.uaなど



「バルセロナ」、「バルカ」、「バッジャーズ」などの単語のコンテキストで「マンチェスター」、「マンチェスター・ユナイテッド」、「マンクニアン」などのキーワードを検索しました...



最も難しいステップは、もちろん、予測の調性の分析、つまり、著者が特定のコメントを誰に付けているかを判断することでした。

これを行うために、大きな辞書がコンパイルされました。これは絶えず更新されていました(今回は個人の語彙を大幅に拡張しました!)。たとえば、 「win」、「do it」、「beat」、「merge」、「blow through」など、多くの類似物です。 ただし、この場合のタスクは本当に簡単ではありません。フォーラムの「生きているグレートロシア語」言語を自動的に解釈するのが難しいため(たとえば、特定のチームに有利なアカウントである場合など)、参照のかなりの部分が処理されました手動で評価しました。



予測比率を備えた最も人気のある解説ソース:





1万5千件以上のコメントが収集され、サッカートーナメントの決勝戦について議論され、1/4未満のコメントが勝者の明示的な表示を含んでいた。 その結果、約60%(204)の票がマンチェスターユナイテッドの勝利に投じられ、残りの40%(145)だけがバルセロナに投じられました。







もちろん、多くの困難に直面しました

まず第一に、それは情報と処理の技術的なコレクションです。 ロシア語は非常に豊富であるため、すべての言及を計算することは困難ですが(試してみましたが)、特定の言及を逃れる可能性があります。



第二に、コンドルセの定理を読み直した場合、予測の正しい結果の重要な指標は、それぞれ50%以上の正しい予測の確率です。 私たちはこの状態に耐えることができたと信じています。 言及は、サッカートーナメントをフォローし、チームの強さを知っている、人々が最初からではなく予測を与える専門のサッカー会場から収集されました。



第三に、心理学もある種のエラーをもたらす可能性があります。バルセロナは最近、その進路で全員を押しつぶし、かなりの数のトーナメントで優勝しました。



一般に、この方法論にはまだ磨きと改善が必要ですが、私たちはすでに最寄りのブックメーカーに逃げています:)



また、投票に参加し、今すぐ欧州チャンピオンズカップのオーナーになる人を言うように招待します。 すべての投票はFacebookページに蓄積されます。 参加してくれてありがとう!



そして、habrasocietyは、良い予測の可能性についての意見を知りたいと思います-そして、この種の研究の欠点は何だと思いますか? 建設的なフィードバックに感謝します!



そして元気づけるために-ブロゴスフィアからのコメントのいくつかの例:




All Articles