完璧なハブロポストのレシピ





私たちの意見では、「理想的な投稿」を作成することは、トピックを選択してテキストを書くプロセスだけではありません。 成功のかなりの部分は、デザインと記事が公開された状況にあります。 タイトルの長さ、カット前のテキストの量、魅力的な写真-これらすべての要因には独自の重みがあります。 投稿のデザインと投稿時間を変更するだけで、30%多くの視聴を獲得したいですか?



Cloud4Yで私たちはしたいと思います。 そのため、過去6か月間にHabrahabrの出版物の詳細な分析を実施しました。今日、新しい有用な発見を共有したいと思います。



Habrahabrのビュー数によって出版物はどのように配布されますか



正規分布は、多くの場合、多数の独立したランダムな原因の影響を受けるプロセスを記述するための適切なモデルと見なされます。 この場合、ランダム変数の分布密度は、対称の釣鐘形です。 ただし、場合によっては、たとえば、ビューの数による出版物の分布の場合、その数が負になることはないため、ランダム変数の分布が著しく傾斜していることが観察により示されています。 対数正規分布は、Habré上の投稿の分布を記述するのに最も適しているという結論に達しました。







正規分布または対数正規分布に至るプロセスの違いは何ですか? 前述したように、両方の分布は、多くのランダムかつ独立した要因が記述されたオブジェクトに作用するときに発生します。 各要因の効果が合計されると、それらの相互作用に付加的な特徴があり、正規分布があります。



各因子の効果が加算されずに増加する場合、相互作用の乗法的な性質があり、これはしばしば対数正規分布に対応します。 因子も正規分布の場合のように独立していますが、その影響の影響は以前の数に応じてオブジェクトに蓄積されます。



パブリケーションからビューを収集するプロセスを検討してください。 プロセスを理解することで、適切な統計モデルを構築できます。 投稿の人気は多くの要素で構成されていますが、これについては後で説明します。 公開された記事は、「すべての契約」のセクションに分類されます。 公開時間から、投稿にはセクション「BEST-Per Day」の最初のポジションに進む日、週にセクション「BEST-Per Week」のビューを取得する、などがあります。



ただし、これらでは、他の「BEST」セクションと同様に、記事は評価の降順でソートされます。 記事に投票できるのは、公開されてから最初の72時間までです。 したがって、TOP内の記事の位置に影響する最も重要な指標は3日後にわかり、今後は変更されません。 このソートの結果、後続の各投票が現在の状態に比例してパブリケーションに影響するときに、乗法的相互作用が得られます。 最初の投票の場合、または既存の評価に加えて、1つの投票が異なる結果(ビュー)をもたらします。 既に得られた評価と視聴回数の累積的な効果がなかった場合、記事は正常に配信されます。 この場合、より適切なモデルは、乗法的相互作用と対数正規分布のモデルです。 要因のランダム効果だけでなく、投稿の累積状態も考慮します。



分布モデルを知っていれば、平均値だけでなく、信頼区間の境界も分析に含めて、指標の変動性に焦点を当てることができます。 これにより、読者は平均だけに焦点を合わせることができず、投稿の人気のさまざまな指標を取得する確率的な性質も考慮することができます。



ファクター0-タイトルの長さ



短く魅力的な見出しは、ユーザーが記事の発表を読み始める主な理由の1つです。



おそらく、見出しを超えるユーザーの注意を引くために余分なクレジットを取得するのはほんの一瞬だけでしょう。 短いタイトルがこの標準に適合します。



おそらく、読者は「理想的な」短いタイトルの15文字が少なすぎるので、彼は発表を読み始めるでしょう。 そのため、ユーザーは、katの前に興味深いテキストに惹かれて、すでに記事の全文を開いています。



なんらかの方法で、タイトルの長さが長くなると、ページビューの平均数が減少します。







要因#1-キャットへのテキストの長さと写真の存在



Habréに関する記事の発表が一般リストにあることを説明する必要はありません。 ユーザーは、タグを使用して記事の本文からお知らせのテキストを分離します



<cut />
      
      





6500件の投稿で、katするテキストの長さを計算しました。 テキストの文字数と、YouTubeからkatへの画像またはビデオの存在によって、出版物をグループに分けました。 起こったことは次のとおりです。







ceteris paribusでは、カットの前に写真やビデオを挿入しないと、ビューの約17.5%が失われます。 このインジケータは、アナウンステキストの長さが長くなると低下します。 最も人気のあるのは、1350から1,500までのテキスト長の記事です。 特に写真やビデオを挿入せずにテキストをカットに短くすると、読者がフィードをめくることができないため、記事の人気が低下します。



グラフの最後に、katの前に写真がなく、1500文字を超えるテキストの長さの記事の平均ビュー数では、そのような記事の人気が低下していることがわかります。 どうやら、この理由は、ユーザーが記事を評価し、場合によっては読み続けないことを決定するためです。



また、kat(ulタグ)より前のリストを持つすべての記事が選択から削除されたことも注目に値します。 発表にリストがある場合、カタの長さは文字数ではなく行数で計算する必要があります。



要因#2-出版物のテキストの長さ







収集された最長の記事



グラフは、記事の平均評価がどのように上昇し、出版テキストの長さの増加するスケールに沿って移動するかを示しています。 分析のために、Excelセル内の記事のテキストを収集しました。その結果、記事の文字数は32767文字に制限されていました。 Habréの記事の平均文字数は10500で、記事には32,767を超える記事があり、6525の内の合計232(3.6%)です。 グラフの最後の評価を下げるために、3万から3万文字の記事が最大評価を獲得することだけを想定できます。



テキスト内の画像の出現頻度は、その人気に影響しますか?



いいえ、そのような関係は見つかりませんでした。 出版物を文字数に応じてグループに分けました。 これらの各グループでは、1つの画像あたりの文字数が異なる出版物の平均ビュー数を調べました。 テキスト内の画像の出現頻度が減少する明らかな減少傾向はありません。 記事の人気がテキストに挿入されたコードの出現頻度に依存するかどうかを判断するには、おそらく結果を再カウントする必要があります。





テキスト内の画像の頻度は、記事の人気を決定しません。



要因#3-競争



以前の記事で、 「過去6か月間のHabrahabrに関する出版物の分析。 統計、有用な調査結果、評価」 、土曜日と日曜日に公開された投稿の平均視聴回数が最も高いことがわかりました。 その理由は、最近では週全体で最も少ない数の記事が発行されるためです。 競争が比較的少ない結果、各記事の表示回数が増えます。



分析対象期間の投稿の53.9%は個人のブログに、46.1%は企業のブログに投稿されています。 ほとんどの企業は平日に公開しています。 読者は平日により多くの選択肢があり、各記事への関心はあまりありません。







「理想的な」出版物のレシピ=





これらの推奨事項はすべて、同じ記事に比べて記事の人気を高めるのに役立ちますが、別の時期に公開されたり、デザインされたりします。



最終的に、すべての記事は、あなたの投稿の未来を決定する投票を完了するために72時間を持ちます。 「処方箋」を迅速に準備する場合、状況によってはあなたに利益をもたらすものであり、あなたに有利になるものではありません。 Habrahabrは、各出版物の運命を判断する機会をユーザーに提供します。 したがって、興味深い記事が入力され、ほとんどのビューが表示されます。



PS



コメントで質問をしてください。可能であれば、このトピックに関する関心のある統計を計算して公開しようとします。 vkグループのリンクを使用して、この分析のために収集した公開データを含むExcelファイルをダウンロードできます。



All Articles