情報フィールドのエンティティの言及のダイナミクスを測定します





今日は、人気のあるエンティティのダイナミクスに関するデータを視覚化したダッシュボードを表示し、Habrのユーザー向けに別のインスタンスを設定し、独自のインジケーターを監視する機会を与えて、規則性を追加します。



ここで何が起こっているかの詳細



私たちはインターネットを研究しています。特に、1日のうちに登録された世界のすべてのドメインをバイパスして情報を処理する機会があります。 この製品は非常に複雑であり、一般に、オープンデータの調査を普及させるために、Alexaによると、世界の上位100万サイトを毎日スキャンし、300人以上の常連でコンテンツを計算し、ダッシュボードにインジケーターを表示するインスタンスを立ち上げました。



関心を理解するために、以前に記事が公開されましたが、その調査結果は喜ばずにはいられませんでした。







率直に黄色の見出しにもかかわらず、この記事はかなり良い評価を受けましたが、主なものは次のとおりです。





CA-ハブの314ユーザー、無人で放置することはできず、このディスコのダッシュボードを見に行きました。



statoperator.comにダッシュボードを投稿しました



独自の指標を測定するために、それらを比較するものがありました-数か月間、ダイナミクスの既存のエンティティに関するパブリックドメインデータを投稿しました。





ダッシュボードでの作業中のすべてのインジケーターと設定は、URLでスローされます。



レギュラーシーズンを追加するには?





フォームに記入します



データソース -ヘッダー/ html /テキスト(Webサーバーの応答ヘッダー/ htmlコード/ドキュメントから選択したテキスト)

正規表現の種類 - 正規表現の種類 :言及/ホスト( 正規表現文書にあるものの数/見つかったかどうか)

JAVA正規表現 - 通常



テストはここで便利です



次の反復後、 ダッシュボードにすべての適切な正規者が表示されます。



All Articles