LiveJournal統計

top

カットの下には小さな統計調査があります。これは単に興味深い場合もあれば、LiveJournalに基づいてサービスを開発または保守する場合に役立つ場合もあります。

研究の2番目のバージョン

調査方法



この調査では、統計ページからユーザーの日記が取られました。 10ページごとに5つの日記。 合計200人のユーザーが抽出されました。 1999年以降、サブロックと18以上を除くすべてのレコードがアップロードされています。 190,439件のレコードがリリースされました。 次に、エントリから、ヘッダー、タグ、HTMLマークアップのないテキスト、およびコメントの数が抽出されました。 サンプルはそれほど大きくなく、1%未満ですが、LJのサービスを設計するための基礎として十分に代表的です。 一部のチャートでは、最初の5人のユーザーが除外されました。 非常に大きなノイズを作成しました。 :)それでは、行きましょう。



投稿



利用可能なヘッダー


TitleNoTitle

緑は灰色、灰色はそうではありません。



文字の文字長


TitleLength



文字の長さ


ArticleLength

1列-1000文字。



月あたりの記事


ArticlesPerMonth



曜日ごと


PostDayOfWeek



時計で


PostHour



タグ





ありますか?


TagNoTag

緑は灰色、灰色はそうではありません。



タグの数


TagsCount



タグ長


TagLength



人気のタグ


PopularTags



コメント





投稿あたりのコメント数


CommentsCountLine



パイ形式のエントリに関するコメントの数


CommentsCountPie



テキストの量に関するコメントの数


CommentsTextLenght



列-1000文字。

80 000-グリッチ:コメント自体がエントリのテキストに解析されました。



追伸



この分析が誰かにとって興味深いものであったことを願っています。 あるいは、彼はある種のプロジェクトをもう少し便利にするかもしれません。 誰かがそれらを必要とするならば、私はデータベースから他のメトリックスを検索して満足です。



P.P.S.



来週までに、2006年だけの記録を持つ10,000人のユーザーの代表的なサンプルを作成します。



All Articles