ユーザーの評価に基づいたコンテンツの並べ替えについて

この記事は私にこの投稿を書くように惹きつけました。 多くの人々がこの写真から彼女を覚えています。

画像

この記事は正しいトピックに触れていますが、数学と常識の観点から、それは根本的に間違っています。



それを読んでいない人のために、私はあなたに思い出させます:それはユーザーの評価に基づいてコンテンツをソートすることについてです。 主な問題は、特定の記事(または製品)に5ポイントのマークが1つしかない場合、その評価は5ポイントで100票、4ポイントで1票の記事よりも高くなることです。

画像



数学



著者は、映画「ソーシャルネットワーク」のガラスに書かれた式を使用することを提案しています。

画像

ウィルソン信頼区間



もちろん、これは深刻に聞こえますが、タブロイド小説に基づいた映画の1つのエピソードを除いて、この式をタスクに適用する理由はありません。 信頼区間は元々、仮説がランキングではなく統計によってサポートされる可能性を評価するために作成されました。 信頼区間は必要な確率に非常に依存しており、その選択の原理は記事から明らかではありません。



さらに、著者は5点評価に適用しようとしていますが、この式は2つのオプションを持つ分布のみを説明しています。 これらの目的のために、他の式があります。 サイトにプラスとマイナスの評価がある場合、これも双方向の分布ではありません。 映画では、2つの選択肢がありました。ユーザーは2人の女の子のうちの1人に投票する機会しかなく、ページを閉じる確率は投票よりもはるかに低くなりました。



その結果、ユーザーが投票した場合にユーザーが+を置く確率の下限を、選択したパラメーターのランダム性までの推定値に従って並べ替えることができます。



金持ちは金持ちになる



デフォルトで最高評価の記事がユーザーに表示され、この評価が評価の数に依存する場合、正の反対の効果があります。 古い記事はランキングが高く、より多くの訪問者を獲得し、結果としてより多くの評価が与えられ、若い記事からさらに離れています。

ランダムな評価により、一度にすべての記事が追加された場合でも、いくつかのランダムな記事が飛び上がってより多くの票を獲得し、連鎖反応が再び始まります。

評価がページ訪問数に強く影響する場合は、良心的なユーザーが「トッ​​プ」を消去するように正と負の評価を使用するか、任意の形式で評価数を並べ替えパラメーターとして使用せず、評価の上部にある偽の記事を避けるために、検索から除外しますAG.ruにあるように、一定の票数より少ない記事。



プラス/マイナス



肯定的な記事に対するこれらのタイプの評価の主な利点は、投票者の数に依存する評価であり、トップにランダムな投票が1つある記事はありません。 さらに、良い記事の評価は二項分布に近く分布し、その挙動は「ガラス上の式」によってシミュレートされます。



プラス/マイナスは良い評価オプションです。 上部には悪い記事がなく、未検証になりません。 ある種の数学的モデリングよりもユーザーにとって直感的であり、整理が非常に簡単です。 ユーザーは悪い記事を見たことがあるため、その位置に影響を与えることはできないため、このオプションはプラスでのみ悪化します。



ファイブスター



1つの投票のおかげで、記事の評価が高く正当化されない場合に問題が生じるのはこの評価です。 これを回避する最も簡単な方法は、投票数の少ない記事を評価から除外することです。

投票数の少ない記事を除外したくない場合は、この問題に対する多くの解決策がありますが、使用できる正確な答えはありません。 私はそれらのうち最も簡単なものをあげます。



マット まだ誰も投票していない記事の評価(サイト上のすべての記事の平均評価に等しい)の予想(無限の数の投票後の記事の評価の最も可能性の高い値)

マット すでに投票した記事の評価の期待値は、すべての記事の平均評価とこの記事の平均評価の間のどこかになります。 さらに、投票数の増加に伴い、評価は平均評価よりも記事自体の評価をますます考慮する必要があります。 これが実装する最も単純な式は、平均記事と現在の記事の投票数で重み付けされた算術平均です。



画像



ここで、Rはすべての記事の平均評価であり、Nは平均投票数です。 Riはこの記事の平均評価、Niはこの記事の投票数です。 RとNは定数で置き換えることができます-それらは時間とともにわずかに変化します。



保守的な設定を式に追加できます。



画像



K> 0。 Kが小さいほど、新しい記事がSERPで簡単に分割されます。 値が大きいほど、ソートが安定し、「リッチリッチ」効果が強くなります。 K = 0の場合、ソートは最も単純なオプションに削減されます。



総合評価



すでに述べたように、主な問題は、特定の記事(または製品)に5ポイントのマークが1つしかない場合、その評価は5ポイントで100票、4ポイントに1票の記事よりも高くなることです。 言い換えれば、声は異なる重みを持っています。 この欠点がない唯一の単純な評価は、プラス/マイナスです。 ただし、スターはユーザーにとってより身近なものであり、YandexおよびGoogleの発行に推し進めることができ、ユーザーは製品の良さを判断できます(4つ星は+40よりもわかりやすい)。



したがって、2つのオプションを組み合わせることができます。「星」をユーザーに表示しますが、プラスとマイナスで並べ替えます。 投票により、記事1のスコアが高い場合、たとえば3であれば増加し、低い場合は1減少します。 少し複雑になる可能性があります。投票により、ユーザーが設定したポイント数から記事の平均評価(R-Ri)を引いた数だけスコアが増加します。



ただし、この場合、評価の保守性と「リッチゲットリッチ」効果は、加重平均バージョンよりも高くなります。



第二部を読む



All Articles