ユーザーの評価に基づいたコンテンツの並べ替えについて:パート2

前の記事は大きな関心を集めました。 そして、しばらくの間、彼女は24時間で最高になりました。 私にはいくつかのアイデアがありましたが、コメントの質問のいくつかはより詳細に回答する必要があります。

画像







1票 「金持ちが金持ちになる」という問題



主な問題は、記事または製品の評価をユーザー評価の算術平均(最も単純なオプション)と考える場合、5ポイントで1票の記事が5ポイントで1票の記事よりも高い可能性があることを思い出してください4pで これは「単一投票の問題」と呼ばれますが、単一投票の記事だけに存在するわけではありません。



これを防ぐには、投票数を考慮する必要があります。 しかし、これを行うと、「金持ちが金持ちになる」という別の問題が発生します。 古い記事はより多くの票を持ち、評価は高くなり、より多くのコンバージョンとより多くの票を獲得します。したがって、若い記事からさらに切り離されます。 すべての記事が同時に追加されたとしても、この効果は引き続き観察されます。 一番上にあるのは古い記事ではなく、投票開始時にランダムに投票できる幸運な人たちです。



評価で発生する遷移が多いほど、この効果は強くなります。 逆説は、評価が必要になるほど、評価が悪くなるということです。 いくつかの美しい機能を使用して両方の問題を解決することはできません。これらの2つの問題の合計効果を最小限に抑えるために、中間点しか見つけることができません。



いくつかの「スムーズではない」ソリューションがありますが。 たとえば、特定の投票数未満の記事を評価から除外します。 ただし、この場合、記事の一部は長期間評価から削除されます。 記事の移行の大部分が評価から受け取られた場合、いくつかの記事は数年後にのみそれに移行します。 場合によっては、この効果は受け入れられません。



別のオプションは、一定期間の評価を表示することです。 たとえば、ハブのように、過去24時間 金持ちはまだ金持ちになり、数時間の記事は23時間の記事を追い越す可能性がほとんどありません。



プラス/マイナスと正義感



プラス/マイナスの評価では、投票数が暗黙的に含まれます。 長所と短所の合計は、記事が表示される回数に線形に依存します。 すでに述べたように、この評価には「一票の問題」はありません。 ただし、「豊かになる」という効果はほとんどの場合よりも強く観察されるべきであり、他の種類の格付けに対する「一票」の問題を解決します。 しかし、これは起こりません...



ほとんどのユーザーは良心的で、サイトを支援しようとします。 フーリガンは立派な人よりもはるかに小さいです。 これはウィキペディアの哲学であり、ウィキペディアを開くだけで簡単に機能するということです。



ユーザーは、自分が気に入ったプラス記事よりも過小評価された記事を自分の意見にプラスする傾向がありますが、彼の意見では、評価で正しくランク付けされています。 「過大評価された」記事のマイナスは、「正しい」場所にある記事のマイナスよりもありそうです。



数学の観点から、過去24時間のHabrの結果を見ることができます。その記事のほとんどすべてが24時間に近いはずです。 しかし、これはそうではありません。 非常に若い記事はありませんが、3〜5時間しか経っていない記事が最初の記事になることがよくあります。 自己組織化メカニズムが機能します。



星の場合、このメカニズムも機能しますが、さらに悪いことです。



統計誤差



「一票の問題」を克服しようとする場合、特定の金額を計算し、「統計誤差」と呼び、最も単純な場合は記事の評価からそれを差し引く必要があります。 問題は、それをどのように計算するかです。 分布がわかっていても、必要な信頼度に応じて、その係数、誤差はかなりの間隔で変動する可能性があります。 したがって、いずれにせよ、誤差の推定は主観的です。 たとえば、充填機が1リットルのジュース±100mlをジュースパッケージに注ぐことを100%確信することはできません。 オートマトンは失敗する可能性があり、まったく何も注ぎ込むことはできません。もちろん、この確率は小さいですがゼロではありません。



実験物理学では、実験の数が増えるにつれて、その数の根としてランダムな測定誤差が減少することが一般に受け入れられています。 しかし、数学の観点から言えば、これは正規分布にのみ当てはまり、投票結果はそれとは非常に異なる場合があります。 ただし、この方法はどのような場合でも良い結果を生みます。後でこれが起こる理由を説明します。



画像

これがエラーです。 シグマは標準偏差です (以降、標準偏差と呼びます)。 つまり、偏差の二乗和のルート。 これは散布推定の尺度です。 差し引くと、レーティングの下限が得られます。



ここで問題が発生します。 まず、すべてのユーザー評価を個別に覚えている場合にのみ、古い評価でカウントできます。 2つ目は、1票の記事の場合はRMSE = 0であり、少数票の記事の場合はRMSEは統計エラーで決定されます。



これら2つの問題を解決する最も簡単な方法は、DIS規格を記事の評価の割合として考慮することです。



画像



どこ、Ri-記事の評価。 ドット付きのRi-結果の評価。 Riに点がない場合、初期評価はすべての投票の算術平均です。 Nは投票数です。



ここで、kは0〜1です。k= 0の場合、ケースは算術平均に縮退します; k = 1の場合、1票の記事の重みはゼロになります。 kは保守主義の尺度であり、それが高いほど、金持ちはより速く金持ちになりますが、1つの音声の影響は少なくなります。 問題はバランスを見つけることです。したがって、多くの場合、中央が正当化されるため、値は0.5です。



この方法は、「一票」の問題を解決します。 同時に、ルートのために多数の票がある場合、その成長は減速し、「金持ちが金持ちになる」効果を減らします。 ペナルティを10倍減らすには、投票数を100倍増やす必要があります。 したがって、この方法は正規分布だけでなく適用できます。



置換



前の記事の式(平均重量)と比較すると、投票数が多いため控えめです。 言い換えれば、記事への多数の訪問による「金持ちになる」という効果は弱くなるでしょう。 ただし、この式には欠点があります。 それが何を反映しているかは不明であり、過去の公式は実際の記事の評価の評価でした。 もう1つの問題は、記事の評価が最小評価よりも低い場合があることです。k= 1およびn = 1の場合、最小評価として通常は1ですが、評価はゼロです。



概して、この式では、信頼性が低いと判断した記事の評価の一部を取り、削除してゼロに置き換えました。 評価が1つから来る場合は、ユニットと交換する必要があります。 ただし、すべての記事の平均評価に置き換えた場合、結果は、その下限ではなく、記事が将来受ける評価の評価になります。 どちらがより正確で、私たちの評価は理にかなっています。 下限を比較することはほとんど意味がありませんが、マットを比較します。 予想(予測)-です。 さらに、若い記事の「金持ちになる」効果を減らします。 最初は、若い記事はランキングの最後ではなく、その中間にあります。 結局のところ、投票のない記事は、ほぼ確実に100の最低評価の記事よりも優れています。



画像

ダッシュ付きのRは、サイト上のすべての記事の平均評価です。 この式は、平均的な記事の評価の割合と同様に、記事の評価の一部を置き換えます。 これにより、若い記事の肯定的な評価だけでなく、否定的な評価の影響も軽減されます。



これは、平均評価のある記事の平均評価です。 ここで、これが平均記事評価の算術平均であり、係数が1-k / sqrt(n)(評価の信頼できる部分の推定値)およびk / sqrt(n)-(記事の評価の信頼性の低い部分)の係数を持つすべての記事の平均評価であることを証明します。



画像



加重平均値は、常に要素の最小値と最大値の間にあります。 つまり 最終評価は常に必要な範囲内にあります(たとえば、5つ星の場合は1〜5)。 それは常に「単純な評価」と平均的な記事評価の間です。



私たちの式はn = 0で不確かであり、その価値について記事の平均評価を採用します。 その結果、式は次の形式になります。



画像



この記事が知覚にとって非常に簡単であることが判明した場合、それを続けて、標準偏差を考慮した評価の改善方法と、「好きな」スタイルの評価、およびガラス上の式がまだ適用できる場合について説明します。



PS誰かが数千票のベースを持っている場合。 そして、声は別々に記憶されます。 それは共有する大きな要求です。 いくつかのデータベースは、数値予測指標を提供します。



続編を読む



All Articles