注目プロフィールとお気に入りの著者

最もアクティブなHabrユーザーのプロファイルでは、出版物の特定の著者に対する個人の関心を反映したブロックが表示されました。 ニックネームが大きいほど、関心が高まります(すべてが標準のタグクラウドに似ています)。



画像






この素晴らしいことと同時に、 アテンションプロファイルブロックが変更されました。 短縮名(以前は覚えていなかったほど長かった)に加えて、構築アルゴリズムが改善されました。



これらの2つのブロックを処理するプロセスは非常に興味深いことが判明しました。以下では、いくつかの興味深い観察結果を公開します。



まず

注目のクラウドの希少なユーザーには、 AppleGoogleHabrahabr(Habréで最も一般的なタグ)が欠けているという傾向に気付きました。 すべてのタグが平準化された場合、クラウドはどうなりますか? その結果、「関心」の定量的特性から頻度特性に切り替え、サイト上のタグの重量への依存を式追加しました。



それは何を与えましたか? アテンションプロファイルはあまり変更されていませんが、あまり一般的ではないタグが表示されています。 例えば、私のプロフィールには集合的な心が現れており、 Aistには 高い負荷が かかって います 。 そして、それは現実を反映しています。



ちなみに、同じ原則が「 お気に入りの著者 」にも適用されましたが、私は出版物の数を重要視しました。



第二に

特定のタグが愛されていなかったのと同じくらい愛されていたようなケースを登録しました。 このノイズを除去することにしました。 これに先立ち、計算ではプラスのユーザー評価のみが考慮されましたが、マイナス評価も考慮されます。



第三に

ユーザーが作成した投稿タグを検討するというアイデアがありました。 人が自分が書いたものを読むことに興味がないことがわかった時の驚きを想像してください。 人々は自分の力量のある分野のトピックについて書きますが、すでに知っていることを読むことに興味はありません。 そのようなもの。 これは絶対法ではなく、統計法であり、多くの例外があります。 たとえば、 XaocCPSは、両方のクラウドがほぼ同一であることがわかった唯一のユーザーです。



フィードバックを待っています



PSところで、今回の肯定的な注意に加えて、ユーザーが嫌いなものを非常に定性的に反映する否定的な注意プロファイルを構築することができました。 この情報を利用可能にする提案がありますが、明白な理由のために、あなた自身のプロフィールでのみ



All Articles