habrablogsでhabrastatisticsを収集するためのHabrautility

新年-在庫を取る時間。 また、ハブでブログを作成している場合、または他の誰かのブログで統計を確認したい場合は、私のオープンソースユーティリティが役立つかもしれません。







どのような統計が生成されますか?



すべての記事に関する基本情報を含むCSVファイル:







(スクリーンショットの拡大版はクリックで入手できます)



ビュー/コメント/プラス/ブックマークの数を担当するブログ作成者の情報を含むCSVファイル。







同様の情報を含むが、ハブごとにグループ化されたCSVファイル。







同様の情報を含むが、タグでグループ化されたCSVファイル。 タグをダウンロードするには、記事のリストだけでなく各記事も個別に読み込む必要があります。そのため、必要ない場合は、 -skipTagsフラグでデータのダウンロードプロセス高速化できます。







まあ、そしてボーナスとして-同じ情報を持つJSONファイル。







入手先



ソースはGitHubにあり、ユーティリティはJava 10で書かれており、 JARはすでにコンパイルされています。使用手順と例はリリースセクションの同じ場所にあります。



仕組みと使用方法



Habrahabr APIは神話*であるため、ユーティリティはjsoupを介してHTMLを単純かつ陰気に解析します。 個人ブログと企業ブログの両方に対してユーティリティを設定できます-それはすべて同じです。



企業ブログの場合https://habr.com/company/JetBrains/



ように、プログラムにブログ自体へのリンクを提供しhttps://habr.com/company/JetBrains/







個人のブログの場合は、たとえばhttps://habr.com/users/milfgard/posts/



ような投稿のあるページを指定する必要がありhttps://habr.com/users/milfgard/posts/







より詳細なヘルプがアプリケーションに組み込まれ、さらにリポジトリにreadmeファイルがあります。



*たぶんそうではないが、そのような情報を見つけることができなかった



バグを見つけた/別の機能が欲しい



それは質問ではありません-バグや要望をGithubの問題 、提案、改善に残してください-プルリクエストの形で。 さて、またはコメントでここに!



All Articles