直感的なネットワーク監視
長い間、私はHabrの読者ですが、記事を書くことで、質問に答えたいと思いました。 「チュクチは作家ではありません。」という記事の混乱の可能性をおIびします。
Habréには、このシステムに関する記事がいくつかあります( 「ObserviumシステムでのCiscoネットワーク機器の監視」 、 「Observium-監視システムのインストール」 )。それらを補足したいと思います。 この記事にはインストール手順や構成手順はありません。これらはすべて公式ドキュメントと上記のリンクにあります。
記事には多くの写真があり、一部はネタバレの下に隠されています。
Observiumは、メインサイトのスローガンにあるように、ネットワークデバイスとサーバーを監視および監視するためのシステムです。 同時に、サポートされるデバイスのリストは膨大であり、ネットワークデバイスだけに限定されません。主な条件は、デバイスがSNMPをサポートしていることです。 ただし、SNMPのほかに、収集された情報は、syslog、rancid、unix-agentなどの他の方法とプロトコルで補足できます。
少し歴史。 当初、このシステムは2005年から2006年頃に「His下の主題」アダムアームストロングによって作成されました(残念ながら、彼自身は正確な日付を覚えていません)。 その後、謙虚な使用人を含む開発者がプロジェクトに参加しました。 最初はシステムはKikker(2005-2006)、次にProject Observer(2006–2008)、ObserverNMS(2008–2010)と呼ばれ、最後に2010年に現在の名前Observiumを取得しました。 メインのロゴは、工業的な外観のハムスターです。
作成の主な目標は、デバイスの最も単純な制御と監視を備えたシステムを作成することでしたが、これは現在でも残っています。
システムの配布モデルは、コミュニティ(6か月ごとにリリース)とサブスクリプション(継続的な安定/ローリングアップデートを通じてサブスクライバーが利用可能)に分かれています。
多くの人はcacti、prtg、mrtgなどのシステムに精通していますが、デバイスの追加の利便性とサポートされているセンサーの数(デフォルト)の点で比較できるものはありません。
新しいデバイスをシステムに追加するプロセスは次のようになります。
1.デバイスの名前を追加します(コマンドラインまたはWebインターフェイスで)。
2.検出プロセスと最初のポーラーが完了するまで、5〜10分待機します。
実際には、新しいデバイスを追加するには、デフォルト設定で十分です。認証パラメーターを指定するだけで済みますが、一般構成に追加することもでき、システムは指定されたすべての認証パラメーターを自動的にチェックします。
デバイスの追加、スポイラーの下を参照
新しいデバイスの追加:
デバイスが追加されました。検出/ポーラーが完了するのを待ちます:
デバイスが追加されました。検出/ポーラーが完了するのを待ちます:
デバイスの概要:
さらに、デバイスのリストを含むファイルから、および/またはCDP / LLDPおよびBGP / OSPFプロトコルを使用したデバイス検出により、自動モードで新しいデバイスを追加できます。
デバイスがシステムに追加された後、その「ライフ」サイクル全体が自動的に監視されます。 たとえば、メモリが増加した場合、新しいセンサーが追加された場合、またはポートが追加/削除された場合、これはすべて手動での介入なしで検出されます。
統計のコレクション全体は、2つの主要なプロセスに分けられます。
- このデバイスでサポートされているセンサーまたはカウンターの基本的な検出が実行される検出。
- ポーラー 、検出されたセンサーは5分ごとにポーリングされます。
また、ポーラープロセスと連携して動作する2つの追加プロセスがありますが、これらはサブスクライバ用のバージョンのみになります。
- bill 、ユーザーの個々のポートに関する請求情報の計算。
- alert 、これはシステムによって収集されたほぼすべてのパラメーターの通知を生成する比較的最近のプロセスです。
次に、プロセスは、収集された情報に対応するモジュールに分割されます。 多くのモジュールがあり、主なものはos、システム、ポート、mempool、プロセッサー、センサーなどです。 上記のスクリーンショットでは、OS、バージョン、デバイスの充填などのパラメーターが収集されていることがわかります。
最後に、モジュールはMIBに分割されます。MIBは、さまざまなオペレーティングシステムの定義ファイルから取得されたリストです。
情報は、デバイスの製造元、種類、および特定のデバイスで使用可能なセンサーによって異なります。 ネタバレの下にはいくつかの例があります:
各種デバイス
Cisco 7606
Cisco 2960C
APC PDU
Olivettiプリンター
Cisco 2960C
APC PDU
Olivettiプリンター
概要ページ:
もう少しネタバレ
すべてのデバイスの概要:
クイック検索:
IP / MAC / ARP / FDBで検索:
BGP:
RANCIDおよび構成変更履歴:
クイック検索:
IP / MAC / ARP / FDBで検索:
BGP:
RANCIDおよび構成変更履歴:
システムは、syslog、rancid(最新の変更の表示を含む)、collectd、smokeping、nfsenなどのさまざまな外部ユーティリティと統合されます。
センサー監視はIPMIでサポートされています。
unix-agentを介して、Apache、Nginx、Mysql、Bindなどの監視サービスがあります。
一部の仮想化システムの監視がサポートされています。
上記のように、有料版にはアクティブな通知のプロセスがあります。 現在、ポーリングデバイスの5分間隔に制限されているため、nagios / icingaやzabbixなどのシステムを置き換えることはありませんが、通知のニーズの60%を提供できます。 また、デバイスの数が少ない(<50)システムの場合、彼は他のシステムを完全に交換する準備ができています。 ネタバレの下には、彼のためのいくつかの写真があります。
アクティブな通知
検証ルール:
現在の通知:
通知ログ:
現在の通知:
通知ログ:
写真で、おそらく十分に、表示しないでください。 ほとんどの機能は、デモページで見ることができます( ああ、habraeffectを作成しないというリクエストのみ )。
残りの部分については、記事を補足する必要がある場合は質問や提案をお願いします。