Habrahabr、統計、および...タグクラウドについて

こんにちは

約1か月前に、著名なhabrapublicの裁判所にいくつかのグラフを提示した記事を書きまし 。 可能な限りグラフはこのサイトの開発の歴史を反映し、そのサイトのコンテンツの品質を評価しようとしました。 彼らが目標を達成できたかどうかさえわかりませんが、全体としてはかなり温かく迎えられました。 それでも、できればこのトピックを続けていくと約束しました。







そして再びテーマの内容について



前回、グラフと円グラフを使用してHabrahabrのテーマコンテンツを反映しようとしました。グラフと円グラフは、 ブログの特定のカテゴリに属する​​多数の記事に作用しました。 そして、正直なところ、私はそれを非常にひどく管理していたと思います。



結局、サイトのテーマコンテンツを時間内に反映する方法がいくつかあるはずだと思いました。 残念ながら、グーグルは結果を生み出しませんでした-人類は古き良きスケジュールよりも良いものを思いついていません。 しかし、ちょっと! 結局のところ、私たちはWeb 2.0の時代に生きており、その主なシンボルの1つは...通常のタグクラウドです。 あなたは皆彼に何度も会ったことがありますが、それは不可能なことであり、すでに2つおきのサイトで、そして様々な3d-shnoフラッシュ形式でさえあなたの注文に悩まされています。 しかし、公平に言えば、タグクラウドは、サイトのテーマコンテンツを非常によく反映しているため、その人気を獲得しています。 しかし、タグクラウドを描画し、時間とともに動的に変化させようとするとどうなりますか? そのようなタイムタグマシン。 さらに、ビジネスは小さいままでした。すべてがどのように見えるかを考え、それをより動的にし、WPFで考えられていたものの実装に夜を捧げ、もう1つの夜をビデオにレンダリングしてコーディングします。 私がやったことは、「Tag Tornado」または「Twister of Tags」と呼ばれていました。 実際、次のビデオでこの機会の主人公を見ることができます。

* YouTubeで「ビッグ」プレーヤーと解像度480pで動画を視聴することをお勧めします

**私はビデオの音楽を拾うことができませんでした、私は視聴者にその選択を任せます。 座って、座って楽しむ



どのように機能しますか?



はい、それは非常に簡単に動作します-ブログ名は一定の角速度で円の共通の中心を中心に展開します。 連続する各瞬間(この場合、2時間単位)で、各ブログの「重み」が計算されます。 ブログの重みは、約2週間にわたる記事の合計評価に依存し、各記事の評価には、検討中の瞬間から公開された瞬間の除去係数が乗算されます。 一般的に、記事が与えられた瞬間に近ければ近いほど、その評価は体重に影響します。 特定の瞬間のすべてのブログの重みを計算した後、それらは正規化され、最大評価で割ることによって間隔[0; 1]に適合します。 最大重量が0.1を超えたことのないブログは、通常は破棄されます。

重みは3つのパラメータに影響します。大きいほど、タグの中心からの距離が小さくなるほど、フォントサイズが大きくなり、テキストの透明度が低くなります。 タグは辞書式にソートされます。 これに加えて、いくつかの追加要素が追加され、「シーン」でのタグの出入りの全体的な滑らかさが保証されます。



結論の代わりに



気配りのある退屈な読者は、ビデオでスピンしているのはHabrahabrのブログではないことに気付くでしょう。しかし、私は既に答えを持っています。あまり有用ではありません-あまりにも多くの重要な情報が失われます。 前の記事のように同じカテゴリーを視覚化しても意味がありません。カテゴリーが少なすぎるからです。

また、タグが互いに入り込むこともありますが、個々のフレームではなくダイナミクスを見ると、読みやすさはほとんど干渉しません。

そして、はい、視覚化の名前については、最初は「渦」と呼びたかったのですが、その結果、タグクラウドとの「大気」の類似性が優れているという結論に達しました。

ご清聴ありがとうございました。




All Articles