ログからのリクエストの詳細な統計

最近、Google App Engineでの統計の収集に関する投稿がありました。 このような目的で使用するレシピの1つを次に示します。



 #!/bin/bash appcfg.py --num_days=10 request_logs code/ today.txt visitors -A -m 50 -T --time-delta 10 --trails --prefix http://toptuby.appspot.com/ today.txt > today.html firefox today.html
      
      





したがって、 toptuby.appspot.comアプリケーションの過去10日間の統計情報がブラウザーの統計に表示されます



appcfg.pyを使用するサーバーログダウンロードできます。 上記の例では、today.txtファイルに配置されています。 その後、これらのログは、最小限のビジターログアナライザーによって分析されます。 すべてのログ、テーブル内のフィールドの最大数、タイムオフセット、およびサイト内の一般的な遷移を表示する必要があるという事実を考慮する必要があることが示されています。 結果は、任意のブラウザーで表示できるhtmlページです(すべてのグラフと図はhtml要素を使用して作成されます)。 プログラムのウェブサイトにはレポート例あります。 パラメーターなしでコマンドラインに入力するだけで、appcfg.pyと訪問者の両方のパラメーターについて詳しく知ることができます。



したがって、一度に、ロボットの動作を含む最新の統計を取得できます。 appcfg.pyには1000リクエストという制限はありません-ログと5000を超えるエントリをダウンロードすることは可能ですが、これには時間がかかります。 訪問者は、1日あたりのユニーク訪問者数、Googleからのクリック、外部リンク、ブラウザー、オペレーティングシステム、ロボットなどに関するレポートを生成します。



訪問者の欠点は、WindowsではCソースからアセンブルする必要があることです(私はそこでは決してしませんでした)。 Linuxの下では、Ubuntuリポジトリにもあります。 驚くべきことに、このユーティリティはウィキペディアのWebアナライザーのページには記載されいません。 このアプローチでは、そこに「ログファイルベース」と記載されているものをすべて使用できます。



ウィキペディアにリストされていない興味深いログアナライザーを使用している場合は、コメントに注意してください。



All Articles