Habrの例に関する20/80の原則

どういうわけか、パレート法Habrのような自主規制されたリソースに基づいて行動するかどうかが面白くなってきました 。 この場合、パレート法が「20/80原則」であることを簡単に思い出します。ユーザーの20%が結果の80%をもたらすと解釈できます。 そして、私たちのリソースには、多様で独立した分散した群衆の意見に基づいてユーザー結果を評価する非常に正確な方法があるためです。 考慮に入れてください。 評価方法については、James Shurovieschiの著書「The Wisdom of the Crowd」を読んだ(ハバロフスク市民なら誰でも知っているべきだと思う)。 カルマ (他のユーザーによるすべての時間のアクティビティの合計結果)と評価 (Habrの合成アルゴリズムによる過去50日間のアクティビティの結果)の値が評価に使用されました。



データを取得するために、 統計はギャバーとグラブのユーザーから取得されました。 この評価には、登録されているだけでなく、Habrに対して少なくとも何かを行ったユーザーのみのリストが含まれているため、非常に関連性があると見なします。 プログラミングの知識をいくらか応用して、サイトからデータを解析しました。 この記事では、メソッドは特別な役割を果たさないと思います。もしそれがおもしろければ、別に書きます。 その結果、現在のカルマと評価が記載されたユーザーのリストを取得しました。 それで処理されました。



美しさの写真:

画像



計算では、24049人のユーザーが考慮されました。 これらのうち、正の合計カルマは190,371.89で、合計の正の評価は229145.98でした。 結果の概念に最も適しているため、正の値のみが採用されました。 すべてのゼロ以外のユーザーのうち、20%は4810であり、カルマと評価の合計はそれぞれ150318.87と188463.37です。 金額は、カルマとレーティング(トップハブ)の降順で個別にソートされたリストから取得されることに注意してください



ここで、値を分割すると、±3%の誤差で80%に近い結果が得られ、依存関係の存在について話すことができます(式はクリック可能です)



カルマ用 画像



評価用 画像



まあ、これはパレート法が私たちに予告したことです。 しかし、20%のユーザーに適用される他のパラメーターは何ですか?



したがって、すべてのユーザーの合計評価とカルマ(マイナスを含む)はそれぞれ150,403.63と186,244.84であり、肉眼では20%の合計値と一致します。 しかし、まだカウントします。



カルマ用 画像



評価用



±3%の誤差で仮説を受け入れます



「遅れている」ことを考慮に入れると、合計20%のトップユーザーのカルマと評価がすべてのユーザーと同じであると思います。 つまり 遅れているものは互いにキャンセルし、他のシステムでも同じことが起こると仮定できます。 まあ、平均はどうですか。



平均陽性カルマと平均陽性評価の値は、それぞれ7.92と9.53のすべてのユーザーで見つかりました。 評価> =平均値を持つユーザーの数は、それぞれ5449および5008であり、非ゼロユーザーの総数と比較されます。



カルマ用 画像



評価用 画像



全体として、ユーザーの20%が、平均のプラス(つまり生産性)を超えて±3%の評価またはカルマを持っています。



カルマと評価の負の値の影響も観察されました。 それは、合計ですべての負のカルマと負の評価が正の値の合計の20%を占めるという事実にあります。 合計で、すべての否定的なカルマと評価は-39968.26と-42901.14です。 正の値は190371.89と229145.98です。



カルマ用 画像



評価用 画像



±3%の誤差で20%です。



上記のすべてに、ソースデータを使用してプログレッシブ形式のドキュメントを添付します。



当然、値は動的に変化するため、このデータは古くなる可能性があります:)もちろん、完全な統計情報を得るには、長期間定期的にデータを取得する必要があります。 しかし、htmlの解析はこれには適していません。 そして、このデータを削除する問題は、Chip and Daleよりも優れています。誰もこれを解決しません。 おそらく、比率のシフトは、いくつかのイベントと相関するか、周期的な特徴を持つ可能性があります。



また、結果は、具体的に指定された数値パラメーターを持つ不変の自然法則とみなされるべきではありません。 すべての計算は純粋に経験に基づいています。 また、有用なユーザーの20%だけを残すことについて話す場合、パレートの法則に従って、最終的にはルール20/80に従って分割されます。



すべての計算の中で、次の事実を確認できます。「最も成功したイベントは、少数の非常に生産的な力の作用によるものです。 トラブルのほとんどは、少数の非常に破壊的な力の作用によるものです。」



平均して、Habrに招待された5人のユーザーのうち、Habrに役立つのは1人だけだと言うこともできます。



コメントの要求に応じて、降順リストでソートされたカルマと評価の分布の対数チャート。 水平スケールは、ランキング内の場所を意味します。 青いチャートでは、カルマによるランキングの場所(大きい順から小さい順)。 赤についても同様です。







10867から12631の場所の評価の赤いグラフに直接表示されるのは、評価が2の多数のユーザーを意味します。

また、11573から12603の場所に部分的に一致する青いチャートの線は、カルマ2のハバロフスクの居住者を意味します。 しかし、それは新しい研究の理由かもしれません)



始まりと終わりだけを読む人のために:



誤差が±3%の短い結論:

  1. 居住者の20%は、全体の肯定的な評価の80%を持っています。
  2. Habrachiansの20%がすべての肯定的なカルマの80%を持っています。
  3. 上位のhabravchanの20%は、すべてのhabravchanのすべてのカルマの合計と同じくらいのカルマを持っています。
  4. 上位のhabrach居住者の20%は、すべてのhabrach居住者の評価の合計と同じ評価です。
  5. 居住者の20%は、平均陽性カルマを超えるカルマを持っています。
  6. 居住者の20%は、平均の肯定的な評価よりも高い評価を持っています。
  7. 容積による全体的な負の評価は、正の20%です。
  8. ボリュームによるすべての負のカルマは、正の20%です。



All Articles