完璧な投稿、またはHabrの謎を探して



ハブにたどり着く前に、友人たちは、これは招待状を得るのが非常に難しいリソースであり、真面目な人々が集まり、真面目なことを書く場所であり、コミュニティの反応は完全に予測不可能であると語った。記事、そしてそれはzaminusut、そして時々それが起こる、あなたはある種のナンセンスを公開し、それは突然強打で取られます。



かなり長い間ハブにいたので、かなりの数の記事を読んで、自分の記事を書きました。神秘的で予測不可能なハブの印象、外部からの見え方、多くの著者を心配する質問を共有したいです。 ?」



主にhabrayuzersが記事に対して前向きな姿勢を持っていることは明らかですが、プラスよりもはるかに少ないにもかかわらず、間違いなく欠点があります。 そして、これは理解できます。絶対に誰もが好むものを書くことは不可能です。むしろ、それを好まない人を見つけることはできません。 そして考えたのは、マイナス記号が1つもなかったHabréの投稿はありましたか? つまり、200のプラスで、1つのマイナスではありませんか?



突然、この理想的な投稿が現れました。信じられないほど美しいもので、星の静かな美しさのように不可解な明るい感覚を呼び起こします。 彼を見つける方法、単一のマイナスなしの投稿?



私が読んだ記事のうち、少なくとも1〜2分はそのような記事を思い出せませんでしたが、確かに覚えていました。 理論的には、プラスの数が最も多く、マイナスの数が少ない投稿があるはずだったので、そのようなものがある場合は、その月の最高の投稿のリストの最後のどこかでそれらを探す必要があるという論理的な考えがありました。 最後の数ページ(97-100)を見て、そのような投稿を見つけました。



残念ながら、奇跡は起こらなかった、良い投稿でしたが、特別なことは何もありませんでした。 その後、すべての統計を収集して分析する必要があると思いました。 おそらく、マイナスの数が最も少ない投稿にはいくつかのパターンがあります。たとえば、Habrの存在の年月にわたって書かれたセット全体の中で大切な理想的な投稿を示す最大のパターンがあります。



「史上最高」の投稿の100ページすべてをダウンロードし、分析用の簡単なプログラムを作成し、各投稿に「プラス」と「マイナス」の数を割り当てました。 起こったことは次のとおりです。





これらは、X軸に沿ってグラフィカルに表示される1000の最高の投稿であり、緑と赤で示される最終評価(評価)でソートされます-マイナスの数。 不利な点は、最高の記事であってもかじります。 おそらく、トップ500の投稿がプラスの数でソートされて大きく表示される別の写真がより鮮やかに見えるため、短所がチャートの奥深くに「押し付けられた」ことが判明します。





次に、マイナスの数で投稿をソートしました。 写真は予想外でした:



最初はそれが何であるか理解できませんでした。 ここで、各歯は同じ数のマイナス(左、1、2など)を持つポストであり、プラスの数で内部でソートされています。 ちなみに、最後にはマイナスが1つもなかった投稿が2つしかありませんでした。 絵自体は面白いですが、ここではこれに注意を払いました。理論的には、歯の高さは正規分布またはランダム分布でなければなりませんが、最初の10個は奇妙な二重階段に位置していることが明らかです



マイナス1〜5の数の投稿の最大評価が連続して増加し、その後に低下し、その後6から10に均一に増加するのはどうしてですか。 いくつかの超自然的な力がここで試したことを除いて、私はこの事実の説明を見つけませんでした。



同じ月のベストの統計を見ると、異常なしに正規分布が表示されます。





これらのプロングの上部にある記事を読んだ後、私は考えました:さまざまな方法でマイナスの数を考慮すると、投稿がどのように配布されるのだろうか? つまり、たとえば、それらに5を掛けると、マイナスが非常に少ない投稿のみが上部に残ります。 私はそのような実験を行いました:負の係数があり、それを考慮した評価が次のように計算されると仮定します:



R = P-N * KN



ここで、Pはプラスの数、Nはマイナスの数、KNは負の係数です。



たとえば、いくつかの抽象的な投稿を考えてみましょう。



-有用または興味深い情報を含む投稿。130個のプラスを入れますが、一部はまだ何かが好きではなく、4個のマイナスを入れます。

-お祝いの言葉(リソースまたは発明の記念日)が肯定的に受け入れられた(140プラス)が、一般的に愚かであるため、多くのマイナス(27など)がある。

-賛否両論で多くの票を獲得している著作権など、物議を醸すトピックに関する投稿。

-たとえば、特定のアルゴリズムの実装に関する有用ではあるがあまりおもしろくない投稿は、27プラスしか得られませんが、8人はすべてが間違っていなければならないと信じ、マイナスを付けています。



通常の評価式では、負の係数KN = 1の場合、投稿は次のように配布されます。



KN = 5の場合、多くのマイナスがある投稿は下に下がります-「著作権」は省略され、アルゴリズムに関する記事に取って代わります:



KNも増加し、誕生日も下がります。KNが増加すると、テーマの投稿が両方とも上部に表示され、問題のある投稿が末尾に残ります。



次に、負の係数エンジンを他の方向に動かし、マイナスの重みを減らします。



ここでは、誕生日がすぐに発生し、多くの利点を集めています。 そして、まだ係数を減らした場合:



そして、そもそも著作権であり、他のすべてを下に移動していることがわかります。 したがって、必要に応じて、楽観的なユーザーは、マイナスの数に関係なく、最大の肯定的な反応を示す投稿を見つけることができます。



実際のデータと最高の投稿の統計でこの係数を少し試してみて、x軸を横切ったのでかなり奇妙に見えるグラフを作成しましたが、これは特に面白くなかったので、評価平面に投稿のグラフを作成することにしました。 X軸上-プラス、Y軸上-マイナス:



この写真の中の何かは、まるで火花が宇宙に飛ぶように、私が最初に見たときに長い間見ていました。 これは、史上最高の投稿のグラフであり、史上最高の投稿の中で最悪の評価(170)の境界によって切り捨てられていることがわかります。 そして、記事の冒頭で、曲がったものだけが切り捨てられる月のスケジュールを設定しました。 両方の写真から、私たち全員がそのように知っていることを明確に見ることができます:ハブ上の珍しい投稿が500以上に達し、ほとんどが飛行機にほぼ均一に分布しています。 それから私は最終的に、理想的な投稿はなく、それを見つけようとする試みは放棄されるべきであると確信しました。そうでなければ、結果は予測できません。



しかし、habruiserがプラスまたはマイナスをクリックするのはなぜですか? 実際、ここで与えられた最初のチャートを作成する前でさえ、このアイデアははるかに早く思いついた。 たぶん私は間違っていますが、ここに私の印象があります:



これは、多くの人が考えるように、マシンのように考え、有用な情報のみを公平に評価し、他のすべてを一掃するIT従業員向けのサイトですが、投稿を評価するHabrovskの人々は、心だけでなく感情によっても導かれるように思えます。 ヒントにあるように、「いいね」または「嫌い」という目的のために、投稿の下のボタンを使用します。



読んだ後に否定的な感情が生じた場合、それが多数の手紙、誤解、resみ、または他の何かを切望しているかどうか-これはマイナスです。 ポジティブな感情-そして、それがノスタルジア、インスピレーション、または他のポジティブな感情を引き起こす場合、情報が便利になる、考えさせる、または単に面白いので、それはなぜかは関係ありません-これはプラスです。 誰もが面白い記事を書き込もうとしますが、彼女がそれを好きになるかどうかを推測することはできませんが、著者は人々がそれを読むときの気持ちを想像することができます。 今日、この記事を公開することで、そうかどうかを知りたいと思っています。



All Articles