カットの下には小さな統計調査があります。これは単に興味深い場合もあれば、LiveJournalに基づいてサービスを開発または保守する場合に役立つ場合もあります。
研究の2番目のバージョン 。
調査方法
この調査では、統計ページからユーザーの日記が取られました。 10ページごとに5つの日記。 合計200人のユーザーが抽出されました。 1999年以降、サブロックと18以上を除くすべてのレコードがアップロードされています。 190,439件のレコードがリリースされました。 次に、エントリから、ヘッダー、タグ、HTMLマークアップのないテキスト、およびコメントの数が抽出されました。 サンプルはそれほど大きくなく、1%未満ですが、LJのサービスを設計するための基礎として十分に代表的です。 一部のチャートでは、最初の5人のユーザーが除外されました。 非常に大きなノイズを作成しました。 :)それでは、行きましょう。
投稿
利用可能なヘッダー
緑は灰色、灰色はそうではありません。
文字の文字長
文字の長さ
1列-1000文字。
月あたりの記事
曜日ごと
時計で
タグ
ありますか?
緑は灰色、灰色はそうではありません。
タグの数
タグ長
人気のタグ
コメント
投稿あたりのコメント数
パイ形式のエントリに関するコメントの数
テキストの量に関するコメントの数
列-1000文字。
80 000-グリッチ:コメント自体がエントリのテキストに解析されました。
追伸
この分析が誰かにとって興味深いものであったことを願っています。 あるいは、彼はある種のプロジェクトをもう少し便利にするかもしれません。 誰かがそれらを必要とするならば、私はデータベースから他のメトリックスを検索して満足です。
P.P.S.
来週までに、2006年だけの記録を持つ10,000人のユーザーの代表的なサンプルを作成します。