負荷平均

tophtopuptimewなどのコマンドの出力を観察すると、ユーザーは負荷平均線に気付いているはずです。



Linuxプログラムトップ



「標準システム監視ツールの概要」の 説明を拡大して、これらの数値の意味を理解しようとします。 したがって、簡単に言えば、数値は、特定の時間間隔(つまり、それぞれ1分、5分、および15分)で実行キューにあるブロックプロセスの数を反映しています。 プロセスをブロックするという概念は、最近nginxについて話すとき、通常よくカバーされています。 :)この場合、ブロッキングプロセスとは、リソースが引き続き動作することを期待するプロセスです。 通常、中央処理装置、ディスクI / O、ネットワークI / Oなどのリソースが待機しています。



負荷平均インジケータの高い値は、システムが負荷に対処できないことを示します。 高負荷で実行されているターゲットサーバーについて話している場合は、通常、オペレーティングシステム(ネットワークサブシステム、同時に開くファイルの数を制限するなど)を微調整すると便利です。 高負荷は、ドライブの障害などのハードウェアの問題によっても発生します。



診断のために、 トップ出力によって提供される他の有用なデータを使用します。 文字列Cpu(s)には、プロセッサ時間の割り当てに関する情報が含まれています。 最初の2つの値は、処理プロセスに対するCPUの作業を直接反映しています。



Linuxプログラムトップ



長く続く高(99-100%)インジケータは、CPUがボトルネックであることを示します。



waパラメータは、単純なI / O関連を示します。



Linuxプログラムトップ



80%を超えると、まったく正常ではないと見なされ、プロセッサが入出力を待機するのに多くの時間を費やすことを明確に示します(通常、これはHDDまたはNICに障害が発生することを意味します)。



ハードウェアに問題がなく、CPUが高速の場合、ソフトウェアに問題がある可能性があります。 問題のあるアプリケーションは、 ps axfuを使用してキャッチできます。 結果の出力は、プロセスのリストと、必要な情報:プロセッサ消費、メモリ、ステータス、および直接プロセスを識別する情報(PIDとコマンド)を提供します。 プロセス状態といえば。 一般的なプロセスの状態は次の3つです(完全なリストはpsのmanページにあります-thanksonix74 ):



後者はまさに私たちが探しているものです。 iostatsystat (FreeBSD)、 straceiperf使用して 、さらにデバッグを行うことができますが、これは別の記事のトピックです。



高い稼働率、低い平均負荷、そしてもちろん幸運! :)



All Articles