しかし、約2か月前、職場で、バックエンドサーバーのURLの応答時間を監視し始めました。 私はすぐに、日中の応答時間が急激に変化することがあると言います(時にはロデオの野生の雄牛のように)。 応答時間は多くの要因に依存する可能性があるため、たとえば、リクエストの結果がすでにキャッシュにあるか、再読み込みされているか、モニタリングの監視時のネットワーク負荷、サーバー負荷などから読み取られます。 理由は異なりますが、ピーク時の発行時間が特定のしきい値を超えるまで、すべて正常で自然です。問題はありません。
この日次チャートは、櫛のような通常のバックエンドモードのように見えます(ミリ秒単位の時間、値が高いほど、悪い)。
スケジュールで見られる問題は異なります(それでは、URL配信の時間を監視するのに役立つことがわかった理由を説明します)。 監視が次のことに気付いたとき、次のケースがありました。
- 更新プログラムを公開しましたが、動作が遅くなり始めました(プログラマーはどこかで失敗しました)。
- いくつかの定期的なバースト(たとえば、他のサービスが特定の時間にこのサービスを「サンドアップ」し、そこからページを引き出し、それにより他のユーザーの信用を失い始める場合、このサードパーティの「スキャナー」からのリクエストの時間または頻度を慎重に計画する必要があります);
- 一部の外部データソースが落ちて、このサービスが結果を取得し、現在そのスケジュールはすでに異常に際立っています(問題は私たちのものではありませんが、外部ソースに対処する必要があり、管理者に問題を通知してください);
- 1秒以上の発行時間の定期的な遅延は、すでにどこかが正しくないことを示しているため、座ってサービスを選択し、ボトルネックが発生した場所を正確に見つける必要があります。
- リストが続く...