だから、会う: Zabbix 。 システムは複数の部分で構成されており、大きな負荷と非常に多数のホストの監視により、これらの部分を複数の個別のマシンに分散することが可能です。
Zabbixの構成
- 監視サーバー自体。定期的にデータを受信し、分析し、アラートスクリプトを実行します。
- データベース(MySQL、PostgreSQL、SQLite、またはOracle)
- PHP Webインターフェース
- エージェント-監視対象オブジェクトで実行され、サーバーにデータを提供するデーモン。 エージェントはオプションであり、それを使用するだけでなく、SNMP(バージョン1、2、3)、データを出力する外部スクリプト、およびping、http、ssh、ftpを介した要求などのいくつかのタイプの事前定義された組み込みチェックを介して監視を実行できますその他のプロトコル、およびこれらのサービスの応答時間の測定。
入門記事の一部として、何が何であるかをよりよく理解し、システムの機能についてのアイデアを得るために、Zabbixで使用されるネットワークモデルについて話す価値があります。
主な論理ユニットは、監視対象のサーバーであるHostsです。 各サーバーには説明とアドレスが割り当てられます(dnsまたはip、両方を使用できます。接続に使用するものを選択できます)。
Webサーバーやデータベースサーバーなど、ノードはグループ化されます。 グループは、監視中に特定のサーバーのみを表示するために使用されます。
各ノードには、いくつかのデータ項目(項目)があります-モニターされるパラメーター。 たとえば、すべてのサーバーにpingパラメーター(組み込みチェックを使用して取得されます)があります。これは、最後のpingリクエストへの回答が受信された場合は1、それ以外の場合は0です。オンライン」は、サイトのデータベースから自作のスクリプトによって収集されます。 データ要素ごとに、更新期間、保存方法(パラメーター自体または変更率)、乗数、収集時間間隔(たとえば、勤務時間中のみ)を指定できます。
多くのサーバーのそれぞれにデータ要素を作成するのは難しいため、 テンプレートノードを作成できます。 これらのノードにはデータ要素も含まれていますが、直接監視されていません。 代わりに、実際のホストは1つ以上のテンプレートに関連付けられ、すべてのテンプレートパラメーターはホストによって自動的に継承されます。 したがって、私が持っているping要素はテンプレートに保存され、すべてのホストをテンプレートtemplate_pingに関連付けます。
人はロボットではありません。数千のパラメータを監視し、この値が許容範囲を超えているかどうかを考えることは、単に非現実的です。 しかし、ここでZabbixは、事故や故障の場合にオンになるトリガー条件を設定するための柔軟なオプションを提供し、システムはライト(実際には赤い四角)の点滅を開始し、管理者に何かが起こったことを示すのに苦労します。 ちなみに、トリガーがオンになると、おそらくキーボードで眠りに落ちた観察者を目覚めさせるために、Webインターフェースは目覚まし時計のようにきしみ始めます。 :)だから、ここのスピーカーはおそらく傷つきません。 そして、上記のtemplate_pingには、pingが2分以上存在しないことに応答するトリガーがあります。
また、管理者がいない場合はどうなりますか? 何もありません。Zabbixは非常に独立しており、gsmモデムを使用して電子メールで通知をjabberまたはsmsに送信したり、特定のトリガーが起動したときに開始する定義済みのアクションを実行することで、落ちたサービスを独立して発生させたりすることもできます。
小さな四角に座ってじっと見つめ続け、数字を際限なく実行するのに飽きていますか? 任意のパラメーターのデータに基づいて、システムは、事前定義されたハードセットされた時間間隔(mrtg / rrdtoolを毎日、毎週、毎月、毎年記憶します)ではなく、任意の期間で最大解像度で変更をプロットできます。 1か月前のhabraeffectでサーバーの負荷がどのように変化したかを詳細に確認しますか? 30秒の解像度(これがデフォルトのポーリング間隔)のチャートがサービスにあります。 大きな画像が必要ですか? 月ごとの間隔を選択し、平均値、および最大値と最小値への変動の広がりを確認します。 比較しますか? 1つのフィールドに複数のパラメーターを表示する複雑なグラフを作成でき、負荷平均のピーク値がトラフィックのピークに対応することがすぐにわかります。
ネットワークの論理構造を表示するには、ネットワークノードの位置とそれらの間のリンクを正確に表示するネットワークマップを作成できます。 当然、ノードの状態(使用可能かどうか)もマップに表示されます。
さらに、より便利な概要については、グラフ、データ、トリガーなど、複数のエンティティを同じ画面に一度に表示できる複雑なレポートがあります...
Zabbixはかなり強力で大規模なシステムであり、「ログイン、新しいメッセージの表示、ログアウト」などのスクリプトを自動的に実行してWebサイトのステータスを監視するなど、ネットワークの監視を簡素化するための機能が6つ以上ありますが、まだ触れたこともありません。
スクリーンショットはZabbixの公式ウェブサイトからのものであり、残りはそこにあります(そしてそれらの多くがあります) -http://www.zabbix.com/screenshots.php
近い将来-NagiosとMRTGの代わりにZabbixを使用する方法と、これら2つのシステムからZabbixへの移行と、長所と短所の比較に関する推奨事項。 自分のアラートとデータ収集スクリプトを書くこと、本番環境でZabbixを使用した個人的な経験、このすばらしいシステムのさらなる研究の過程で学んだことについて。