スプリアス相関:統計のセットを使用した「ゲーム」のサービス





多くの科学的およびそれほど科学的でない記事では、統計データのかなり堅固なセットを見ることができます。 そのようなデータのセットは、可能な関係を決定するためにしばしば比較されます。 たとえば、科学者は、定期的な気候変動と、あらゆる地域のカキの個体数の変化を関連付けることができます。 そのようなデータセットに基づいて、広範囲にわたる結論が導き出され、今後数十年にわたるカキの個体群の動態が予測されます。



たとえば、磁場の変化とインフルエンザウイルスの病気の数を比較すると、それほど明らかな相関関係はありません。 多くの場合、このようなデータは非常によく相関しており、初心者は非常に感銘を受けます。



ただし、多くの人は、データを使用して理論を証明し、「病院の平均気温」を自由に調整できることを知っています。 そして、 Spurious Correlationsサービスはこれが真実であることを示しています。 たとえば、さまざまな年のアメリカの年齢のグラフが、蒸気やあらゆる種類の熱い物体による死亡者数のグラフと驚くほど相関していることがわかります。







ナンセンスだよね? そして実際、そのような場合には目に見える接続や隠された接続はありません。



それにもかかわらず、例えば、マーガリン消費のダイナミクスと離婚数の一致が見られます。 接続もありません(おそらく)。



一般に、Spurious Correlationsサービスは統計を「再生」し、平均的な人が計算と比較がどのように行われるかを確認できるようにします。



サービスにはさまざまなデータがあり、データセットを選択することで、同様のデータセットを検索するようにサービスに依頼できます。 もちろん、両方のデータセットが少なくとも何らかの形で関連している可能性は低いです。 しかし、視覚的な類似性は明らかです。



ちなみに、サービスのユーザーは、見つかった「相関」を「興味深い」または「関心のない」とマークすることができ、そのような接続は他のユーザーに表示されます。



もちろん、このサービスは不un慎な「科学者」、あらゆる種類の「密教の普及者」、そして不幸な発明者によって使用されると想定できます。 しかし、それについてはほとんど何もできません。



All Articles