奇妙な問題に直面しました。 訪問のスケジュールには、興味深い「ステップ」が表示されます。 出席者が急増したことを嬉しく思いました。 しかし、分析後、これらはボットであることが判明しました。
「Googleアナリティクスとボット」というトピックでGoogleを検索した場合、主に、ボットはGAの統計に影響を与えないと言われています。 メッセージは、アナリティクスはJavaScriptを使用して訪問者を追跡するということです。 ボット、クリーチャーは原始的であり、JavaScriptを実行できないため、分析では考慮されません。
詳細を見てみましょう。
トラフィック分析
異常な急増に気付いたため、そのソースをローカライズすることにしました。 それは判明した:
- トラフィックにはリファラーがありませんでした。
- サイトのクイックチェックページにアクセスしました。
- チューリッヒからの訪問者。
- 1つのISPから。
この種のトラフィックは、大規模な地元のオフライン出版物がチューリッヒで私たちについて書いた場合に発生する可能性がありました。 これには大きな疑問がありました。 さらに「掘り」続けました。
GAはIPアドレスレベルに到達しません。 Webサーバーのログを調べる必要がありました。 トラフィックは1つのIPから来ました。 ログによると、これらはボットであることが明らかになりました。 2ページが要求されました。 ボットは明らかに高度で、ページ上でJavaScriptを実行し、Cookieを保存しました。 セッションごとに何度か訪問しました。 まともな訪問者を装った。
正直なところ、分析でこの「ジャンク」トラフィックが考慮されていることに驚きました。 熟考すると、高度なボットのフィルタリングは分析だけでは難しいことが明らかになりました。 その後、分析機能のインテリジェンスイベントを思い出しました。 アナリティクスは、画像から外れたアクティビティを示します。 ボットに関連する個別のエントリが実際にありました。 そこにある情報が網羅的であるとは言えませんが、それは思考の土台となります。
対処方法
まず、トラフィックのソースとその特性を見つけようとします。 私たちの場合、ボットを簡単に計算しました。訪問は1つのIPからでした。 ボットネットが作業に含まれている場合、数十個のノードがあっても、そのようなトラフィックを判別することはより困難です。
フィルタリングするには2つの方法があります。
- ボットが気にしない場合は、GAでIPまたはISPによってフィルターを設定します(管理者->アカウント-> AllFilters):
この操作の後、指定されたIPからのトラフィックは考慮されません。 悪いことは、蓄積されたデータを消去できないことです。
- より根本的な方法は、ファイアウォールまたはWebサーバーの構成レベルでアクセスをブロックすることです。
結論
-一部のボットは分析に影響を与える可能性があります。
-ボットはGAの統計を大幅に歪める可能性があります。
-分析に奇妙なアクティビティが現れた場合-このトラフィックの兆候を強調し、これらがボットではないことを確認してください。
-[インテリジェンスイベント]タブを見てください。アナリティクスでは、特徴のない動作を伴うトラフィックセグメントが表示されます。
-Webサーバーのログを見るのが面倒ではありません。そこで、分析に役立つ情報を見つけることができます。
-ジャンクトラフィックをフィルタリングします。