
少し前に、
人気のあるRunetサイトの可用性のランキングに関する基本データの収集を終了しました。 データは非常に予想外であることが判明しましたが、最も興味深いのは、1つの特定のサイトとすべての人気サイトの両方で一度に失われた訪問者の数です。
少し先を見据えて、私は毎日サイト
が約100万人の訪問者を失うと言います。 また、約半数のケースでは、これらの損失は「フローティング」障害、または訪問者の大量流入(および応答の待機時間の超過)により発生するため、ほとんど感知できません。 幸いなことに、これはそれほど頻繁には発生しませんが、経済的にはその効果は非常に顕著です。 たとえば、avito.ruだけで、過去1週間で
14万人近くの
訪問者が失われました。
テクノロジー
WEBO Pulsarサーバーネットワークには、3つの独立したポイント(モスクワに2つ、アムステルダムに1つ)が含まれるようになりました。さらに、毎分多数の外部ポイントがチェックされます。 この情報に基づいてのみ、特定のリソースにアクセスできないという結論が下されます。
評価をコンパイルするために、月に100万人以上がアクセスする数百のサイトが選択され、それぞれについて、接続を行う可能性が1分に1回チェックされます(言い換えると、ブラウザーからサイトにアクセスできるか、エラーでサイトが正しく応答するか、または一般的に答えません)。 週に蓄積されたデータによると、評価自体がコンパイルされます。
もちろん、説明されている技術の実装は簡単ではありません。 しかし、私の意見では、最も興味深いのは、サイトトラフィックに関する情報を収集することです(評価にそれらを含めて、訪問者の損失を計算することです)。
サイトのトラフィック
約2/3のサイトがLiveinternet統計を使用しており、その月の訪問に関するデータが公開されているのは非常に便利です。 これにより、タスクが大幅に簡素化されました。 しかし、残りはどうすればいいのでしょうか?
Alexaが助けになります。これは、サイト全体のトラフィックの割合を測定します。 国とサブドメインごとに分布しているため、ほとんどすべての場合、関心のあるサイトにアクセスしたグローバル訪問者の割合を正確に知ることができます。
1つだけの障害:グローバルユーザーのシェアは、インターネットユーザーの合計数(Alexaがカウントする)を知っている場合にのみ特定の数に変換されます。 そして、これらの訪問者の数は国によって大きく異なります。 たとえば、米国からは半分のユーザーがカウントされ、ロシアからは20%のみです。 どうする?
ここでは、比率を思い出し、Liveinternetデータを基礎として使用します。 2つのモデル(大規模および中規模-大規模サイト)を構築すると、Alexaトラフィックのシェアを把握して、LiveinternetカウンターがインストールされていないWebリソースの
およそのユーザー数を計算できます。 精度は約20%で、評価と評価を行うのに十分です。
最も人気のあるRunet Webリソースは、Liveinternet統計とAlexa評価、およびTNS評価の両方に基づいて選択されました。 データを組み合わせて二重チェックすることにより、人気のあるサイトのかなり正確な画像を取得することができました。
ランキングのすべてのサイトについて、アクセシビリティ(
「9」の観点から )、実際のダウンタイム(時間と分)、およびサイトにアクセスできなかった訪問者の数が計算されます。 サイトの収益性(たとえば、訪問者1人あたり25または50コペック)を知っていれば、そのダウンタイムからの損失を簡単に計算できます。 残念ながら、サイトの収入に関する財務情報は閉じられています。それ以外の場合は、損失が自動的に計算されます。 :)
PS現在、
評価は 1日に1回再集計され、約150のトップサイトがカバーされています。 この番号を250〜300にする予定です。 ランキングへのサイトの組み込み(または可用性)に関する質問については
、メールまたは記事へのコメントでお
問い合わせください 。 現在、1週間あたりの
損失数は130万人です。 カバレッジがわずか10〜20%であるため、上記で発表された数字-
1日あたり100万人の訪問者が失われました 。