ネットワヌク監芖すべおのノヌドが倧䌁業で機胜するこずをどのように確認したすか



この光孊系がフォレストを通過しおコレクタヌに到達するこずにより、むンストヌラヌがテクノロゞヌに少し準拠しおいなかったず結論付けるこずができたす。 写真の台玙は、圌がおそらく船乗りであるこずを瀺唆しおいたす-海掋の結び目。



私は、ネットワヌクの物理的な状態、぀たり技術サポヌトを確保するチヌムから来たした 。技術サポヌトは、ルヌタヌのラむトが必芁に応じお点滅するようにする責任がありたす。 党囜にむンフラを備えたさたざたな倧䌁業が「翌の䞋」にありたす。 私たちは圌らのビゞネスの䞭に登るのではなく、私たちの仕事はネットワヌクが物理的なレベルで機胜するこずであり、トラフィックはそれなりに行きたす。



䜜業の䞀般的な目的は、ノヌドの継続的なポヌリング、テレメトリの削陀、テスト実行脆匱性怜玢の蚭定の確認など、操䜜性の確認、アプリケヌションの監芖、およびトラフィックです。 むンベントリやその他の倒錯するこずもありたす。



それがどのように構成されおいるか、そしお旅行からのいく぀かの物語に぀いおお話ししたす。



い぀ものように



私たちのチヌムはモスクワのオフィスに座っお、ネットワヌクテレメトリヌを撮圱したす。 実際には、これらは䞀定のノヌドpingであり、腺がスマヌトであれば監芖デヌタを受信したす。 最も䞀般的な状況-pingは連続しお数回通過したせん。 たずえば、小売ネットワヌクの80のケヌスでは、これは停電であるこずが刀明しおいるため、この写真を芋お、次のこずを行いたす。

  1. 事故のために最初にプロバむダヌを呌び出したす
  2. その埌-シャットダりンに぀いお発電所に
  3. 次に、斜蚭の誰かずの接続を確立しようずしたすこれは、2晩などで垞に成功するずは限りたせん
  4. 最埌に、䞊蚘が5〜10分で解決しなかった堎合は、問題があれば、むゞェフスクたたはりラゞオストクのどこかに座っおいる契玄゚ンゞニアを確認するか、「アバタヌ」を送信したす。
  5. 私たちは垞に「アバタヌ」ず連絡を取り、むンフラを通じお圌を「ガむド」したす。センサヌずサヌビスマニュアル、ペンチがありたす。
  6. それから、゚ンゞニアは私たちにそれが䜕であったかに぀いおの写真付きのレポヌトを送りたす。




ダむアログは時々このようなものです

-そのため、建物4ず5の間の接続はなくなりたす。5番目のルヌタヌを確認したす。

-泚文はオンです。 接続はありたせん。

-OK、ケヌブルに沿っお4番目の建物に行きたす。ただノヌドがありたす。

-...オッパ

-どうしたの

-ここで4番目の家は取り壊されたした。

-䜕

-写真をレポヌトに添付したす。 SLAで家を埩元するこずはできたせん。







しかし、倚くの堎合、ただ䌑憩を芋぀けおチャンネルを埩元するこずが刀明しおいたす。



電力の䟛絊がシャベル、フォアマン、䟵入者によっお䞭断されたか、プロバむダヌが倱敗を知らないか、むンストヌラヌが到着する前に短期的な問題が修正されるため、トリップの玄60は「搟乳」です。 ただし、ナヌザヌよりも早く、顧客のITサヌビスよりも早い段階で問題に぀いお孊び、䜕かが起こったこずに気付く前に解決策を報告す​​る堎合がありたす。 ほずんどの堎合、そのような状況は、顧客の䌚瀟での掻動が少ない倜間に発生したす。



誰がそれを必芁ずし、なぜ



原則ずしお、倧䌁業には独自のIT郚門があり、詳现ずタスクを明確に理解しおいたす。 䞭芏暡および倧芏暡䌁業では、Enikeyずネットワヌク゚ンゞニアの仕事は倖郚委蚗されるこずがよくありたす。 それは単に有益で䟿利です。 たずえば、ある小売業者には非垞に優れたITスタッフがいたすが、ルヌタヌの亀換やケヌブルの远跡にはほど遠い状態です。



私たちがするこず



  1. チケットやパニックコヌルなどのアプリケヌションに取り組んでいたす。
  2. 予防をしたす。
  3. メンテナンスのタむミングなど、鉄のベンダヌの掚奚事項に埓いたす。
  4. 顧客の監芖に接続し、むンシデントで旅行するために顧客からデヌタを削陀したす。


モニタリングでは、倚くの堎合、そうではないずいう話がありたす。 たたは、5幎前に提起されたものであり、あたり重芁ではありたせん。 最も単玔なケヌスでは、実際に監芖がない堎合、お客様にシンプルなオヌプン゜ヌスのロシア語Zabbixを無料で提䟛したす。これは圌にずっお有益であり、より簡単です。



最初の方法-シンプルなチェック-は、すべおのネットワヌクノヌドにpingを実行し、それらが正しく応答するこずを確認するマシンです。 このような実装では、顧客のネットワヌクを倉曎したり、衚面的な倉曎を最小限にしたりする必芁はありたせん。 原則ずしお、非垞に単玔なケヌスでは、Zabbixをデヌタセンタヌの1぀に盎接配眮したす残念ながら、2぀はVolochaevskayaのCROCオフィスにありたす。 より耇雑な堎合、たずえば、独自の安党なネットワヌクを䜿甚しおいる堎合、顧客のデヌタセンタヌ内のマシンの1぀に







Zabbixはより困難に䜿甚するこずができたす。たずえば、* nixおよびwin-nodesにむンストヌルされ、システム監芖を衚瀺する゚ヌゞェントがあり、倖郚チェックモヌドSNMPプロトコルをサポヌトがありたす。 それでも、ビゞネスで同様のものが必芁な堎合は、既に独自の監芖を行っおいるか、゜リュヌションの機胜が豊富なバヌゞョンが遞択されおいたす。 もちろん、これはもはやオヌプン゜ヌス゜フトりェアではなく、費甚がかかりたすが、平凡な正確なむンベントリでさえすでにコストの玄3分の1です。



私たちもこれを行いたすが、これは同僚の話です。 ここでは、Infosimのスクリヌンショットをいく぀か送信したした。











私はアバタヌオペレヌタヌなので、私の仕事に぀いお詳しく説明したす。



兞型的なむンシデントはどのようなものか



この䞀般的なステヌタスの画面が衚瀺される前







この斜蚭では、Zabbixはパヌティヌ番号、シリアル番号、CPU負荷、デバむスの説明、むンタヌフェヌスの可甚性など、倚くの情報を収集したす。 必芁な情報はすべお、このむンタヌフェヌスから入手できたす。



通垞、通垞のむンシデントは、たずえば顧客の店舗囜内に200から300個の店舗がありたすに぀ながるチャネルの1぀から始たりたす。 7幎前ずは異なり、小売店は珟圚出荷されおいるため、キャッシュデスクは匕き続き機胜したす2぀のチャネル。



電話を取り、少なくずも3぀の電話をかけたすプロバむダヌ、発電所、その堎の人に「はい、ここに備品を積んでいたした、誰かのケヌブルが傷぀きたした...ああ、あなたのそれで、それを芋぀けたした」。



原則ずしお、監芖なしでは、゚スカレヌションの前に数時間たたは数日が経過したす。同じバックアップチャネルが垞にチェックされるずは限りたせん。 私たちはすぐに知り、すぐに去りたす。 ping以倖の远加情報バギヌ鉄片のモデルなどがある堎合、すぐに蚪問゚ンゞニアに必芁な郚品を装備したす。 さらにすでに配眮されおいたす。



2番目によくある通垞の呌び出しは、ナヌザヌによる端末の1぀たずえば、DECT電話たたはWi-Fiルヌタヌの障害です。これにより、ネットワヌクがオフィスに分散されたした。 ここでは、監芖から問題に぀いお孊び、ほがすぐに詳现を含む電話をかけたす。 通話によっお新しいものが远加されない堎合「電話を取りたす、着信音が鳎りたせん」、時には非垞に圹立぀堎合がありたす「テヌブルから萜ずしたした」。 2番目のケヌスでは、これが明らかに高速道路の䞭断ではないこずは明らかです。



モスクワの蚭備は、圓瀟のホットリザヌブ倉庫から取られおいたす。これらのいく぀かのタむプがありたす。







顧客は通垞、故障したコンポヌネントオフィス甚のチュヌブ、電源、ファンなどを頻繁に圚庫しおいたす。 モスクワにではなく、蚭眮されおいないものを配達する必芁がある堎合は、通垞、私たちは自分で行きたす蚭眮のため。 䟋えば、私はニゞニ・タギルぞの倜の旅行をしたした。



顧客が独自に監芖しおいる堎合、顧客はデヌタを圓瀟にアップロヌドできたす。 透明性ずSLA制埡を提䟛するためだけに、Zabbixをポヌリングモヌドで展開するこずもありたすこれはお客様にずっおも無料です。 远加のセンサヌはむンストヌルしたせんこれは、生産プロセスの継続性を確保する同僚によっお行われたすが、プロトコルが゚キゟチックでない堎合は接続できたす。



䞀般的に、私たちは顧客のむンフラストラクチャに觊れず、そのたたサポヌトしたす。



経隓から、私たちはコストの面で非垞に予枬可胜であるずいう事実のために、最埌の10人の顧客が倖郚サポヌトに切り替えたず蚀いたす。 明確な予算線成、適切なケヌス管理、各アプリケヌションのレポヌト、SLA、機噚レポヌト、予防。 理想的には、もちろん、私たちは掃陀機などの顧客のCIOのために来お、すべおをきれいにし、気を散らすものではありたせん。



泚目に倀するもう1぀のこずは、䞀郚の倧䌁業では圚庫が実際の問題になり、その実装のために玔粋に匕き付けられるこずもありたす。 さらに、構成の保管ずその管理を行いたす。これは、さたざたな移動ず再接続に䟿利です。 しかし、繰り返したすが、難しいケヌスでは、これも私ではありたせん-デヌタセンタヌを茞送する特別なチヌムがありたす。



そしおもう1぀の重芁なポむント私たちの郚門は重芁なむンフラストラクチャを扱っおいたせん。 デヌタセンタヌ内のすべお、銀行保険䌚瀟、および小売䞭栞システムのすべお-これはXチヌムです。 これらはこれらの人です。



別の緎習



最新のデバむスの倚くは、倚くのサヌビス情報を提䟛できたす。 たずえば、ネットワヌクプリンタヌは、カヌトリッゞ内のトナヌのレベルを簡単に監芖できたす。 事前に亀換期間を数えるこずができ、さらに5〜10の通知を受け取るこずができたすオフィスが突然、暙準のスケゞュヌルに合わずに猛烈に印刷を開始した堎合。



非垞に倚くの堎合、幎次統蚈が私たちから取埗され、これは同じ監芖システムず私たちによっお行われたす。 Zabbixの堎合、これは単玔なコスト蚈画ず䜕が起こったかを理解するこずであり、Infosimの堎合は、1幎間のスケヌリング、管理者のロヌド、その他すべおのこずを蚈算するための資料でもありたす。 統蚈にぱネルギヌ消費がありたす-昚幎、ほずんどすべおの人が、郚門間で内郚費甚を分散させるために、圌に尋ね始めたした。



時々あなたは本圓の英雄的な救いを埗たす。 このような状況はたれですが、今幎芚えおいるこずから、玄3泊でCiscoスむッチの枩床が最倧55床䞊昇したした。 遠くのサヌバヌルヌムには、監芖のない「愚かな」゚アコンがあり、故障しおいたした。 すぐに圓瀟ではなく冷华゚ンゞニアに電話をかけ、お客様の圓盎管理者に電話をかけたした。 圌は、重芁ではないサヌビスの䞀郚を出し、サヌバヌルヌムをサヌマルショットダりンからモバむル゚アコンを備えた男が到着するたで維持し、その埌スタッフが修理したした。



ポリコムやその他の高䟡なビデオ䌚議機噚は、䌚議の前にバッテリヌの充電状態を非垞によく監芖したす。これも重芁です。



監芖ず蚺断は誰にずっおも必芁です。 原則ずしお、経隓がなくお実装するのは長く困難です。システムは非垞にシンプルで事前に構成されおいるか、サむズの倧きい航空母艊ず倚くの暙準レポヌトがありたす。 䌚瀟のファむルのシャヌプ化、瀟内IT郚門のタスクの実装を考案し、最も必芁な情報を衚瀺したす。さらに、実装経隓がない堎合は、ストヌリヌ党䜓を最新の状態に保぀こずはすくいです。 監芖システムを䜿甚しお、無料゜リュヌションずトップ゚ンド゜リュヌションの䞭間点を遞択したす。原則ずしお、最も人気のある「厚い」ベンダヌではなく、明らかに問題を解決したす。



か぀おは非定型的な治療がありたした 。 顧客は、ルヌタヌをある皮の個別のナニットに、さらに正確に圚庫に応じお提䟛する必芁がありたした。 ルヌタに指定されたシリアルのモゞュヌルがありたした。 路䞊でルヌタヌの準備を開始するず、このモゞュヌルに䜕かが欠けおいるこずが刀明したした。 そしお誰も圌を芋぀けるこずができたせん。 この問題は、昚幎この支郚で働いおいた゚ンゞニアがすでに退職しおおり、別の郜垂の孫に行ったずいう事実によっお少し悪化しおいたす。 私たちに連絡し、怜玢を䟝頌したした。 幞いなこずに、アむロンはシリアル番号に関するレポヌトを提䟛し、Infosimはむンベントリを䜜成したした。数分で、このモゞュヌルがむンフラストラクチャで芋぀かり、トポロゞを説明したした。 逃亡者はケヌブルで远跡されたした-圌はクロヌれットの別のサヌバヌルヌムにいたした。 運動の歎史は、圌が同様のモゞュヌルの倱敗埌にそこに着いたこずを瀺したした。





カメラに察する人々の態床を正確に説明するホタビッチに関する長線映画のショット



倚くのカメラ事件。 䞀床に、3台のカメラが同時に故障したした。 セクションの1぀でケヌブルが砎損しおいたす。 むンストヌラヌは、䞀連のシャヌマニズムが発生した埌、3台のカメラのうち2台に新しいものを波圢に吹き蟌みたした。 そしお3番目はそうではありたせん。 さらに、圌女がどこにいるのかは明確ではありたせん。 私はビデオストリヌムを䞊げおいたす-秋の盎前の最埌のショット-午前4時、顔にスカヌフを着た3人の男性が珟れ、䞋に明るいものがあり、カメラが倧きく揺れ、萜ちたす。



カメラを蚭定したら、フェンスを登る「ノりサギ」に焊点を合わせる必芁がありたす。 運転䞭、䟵入者が出珟するポむントをどのように指定するかを考えたした。 それは圹に立ちたせんでした-私たちがそこにいた15分で、30人が私たちが必芁なポむントでのみオブゞェクトに䟵入したした。 ストレヌトチュヌニングテヌブル。



䞊蚘の䟋を既に匕甚したように、取り壊された建物の話は冗談ではありたせん。 機噚ぞのリンクが消えたら。 所定の堎所-銅が通ったパビリオンはありたせん。 パビリオンは取り壊され、ケヌブルはなくなりたした。 ルヌタヌが死んでいるこずがわかりたした。 むンストヌラヌが到着し、芋始めたした。ノヌド間の距離は数キロメヌトルです。 圌は、セットにVipnetovskyテスタヌを持っおいたす。暙準は、あるコネクタから鳎り、別のコネクタから鳎りたした-怜玢に行きたした。 通垞、問題はすぐに明らかになりたす。





ケヌブルの远跡これはコルゲヌションの光孊郚品であり、海掋結び目に関する蚘事の䞀番䞊からの続きです。 ここで、最埌に、完党に驚くべき蚭眮に加えお、ケヌブルがマりントから離れるずいう問題がありたした。 ここでは、怠け者ではない党員が登り、金属構造物を緩めたす。 プロレタリアヌトの玄5,000人の代衚者が光孊を匕き裂きたした。



ある斜蚭では、すべおのノヌドが玄1週間に1回シャットダりンされたした。 そしお同時に。 かなり長い間、パタヌンを探しおいたした。 むンストヌラヌは次を芋぀けたした。





ある斜蚭では、倜間に蚭備がオフになりたした。 地元の職人が私たちの食べ物に接続し、延長コヌドを匕き出し、そこにケトルず電気ストヌブを付けたこずがわかりたした。 これらのデバむスが同時に動䜜するず、パビリオン党䜓がノックアりトされたす。



広倧な囜の店舗の1぀では、シフトの閉鎖に䌎いネットワヌク党䜓が絶えず䜎䞋しおいたした。 蚭眮者は、すべおの電力が照明ラむンに䟛絊されおいるこずを確認したした。 店舗の倩井照明がオフになるず倚くの゚ネルギヌを消費したす、すべおのネットワヌク機噚がオフになりたす。



管理人がシャベルでケヌブルを砎損した堎合がありたした。



倚くの堎合、匕き裂かれた波圢で銅だけが暪たわっおいたす。 2぀のワヌクショップの間に䞀床、地元の職人は保護なしでツむストペアを投げたした。



文明から離れお、埓業員はしばしば「私たちの」機噚で照射されおいるず䞍平を蚀いたす。 離れた堎所にあるスむッチは、勀務宀ず同じ郚屋に眮くこずができたす。 したがっお、シフトの開始時にフックたたは詐欺垫によっおそれらをオフにする有害な祖母に数回遭遇したした。



別の遠い街では、光孊装眮にモップが掛けられおいたした 。 圌らは壁から波圢をはぎ取り、機噚の留め具ずしお䜿甚し始めたした。





この堎合、明らかに栄逊に問題がありたす。



䜕が「倧」監芖できるか



Infosimむンストヌルを䟋に、より深刻なシステムの機胜に぀いお簡単に説明したす。1぀のプラットフォヌムに統合された4぀の゜リュヌションがありたす。



重芁なこずは、Infosimはすぐに「箱から出しお」䞀連の機噚をサポヌトするこずです。぀たり、内郚亀換党䜓を簡単に分解し、すべおの技術デヌタにアクセスできたす。 ベンダヌのリストは次のずおりです。CiscoSystems、Huawei、HP、AVAYA、Redback Networks、F5 Networks、Extreme Networks、Juniper、Alcatel-Lucent、Fujitsu Technology Solutions、ZyXEL、3Com、Ericsson、ZTE、ADVA Optical Networking、Nortel Networks、Nokia Siemens Networks 、Allied Telesis、RADCOM、Allot Communications、Enterasys Networks、Telco Systemsなど



別途、圚庫に぀いお。 モゞュヌルはリストを衚瀺するだけでなく、トポロゞ自䜓も構築したす少なくずも95の堎合は、正しく詊行および取埗されたす。 たた、䜿甚枈みのアむドルIT機噚ネットワヌク、サヌバヌ機噚などの最新のベヌスを手元に眮いお、時代遅れの機噚EOS / EOLの亀換を時間通りに実行するこずもできたす。 䞀般に、倧䌁業にずっおは䟿利ですが、これのごく䞀郚は手䜜業で行われたす。



サンプルレポヌト



監芖にすぐに統合されるようなものをネットワヌクに配眮するこずもできたす。





Stablenet-Embedded AgentSNEA-タバコのパックより少し倧きいサむズのコンピュヌタヌ。



むンストヌルは、ATM、たたは可甚性チェックが必芁な専甚ネットワヌクセグメントで実行されたす。 圌らの助けを借りお、負荷テストが実行されたす。



クラりド監芖



別のむンストヌルモデルは、クラりドのSaaSです。 1぀のグロヌバルな顧客ペヌロッパからシベリアたでの地理的な分垃を持぀継続的な生産サむクルを持぀䌁業のために䜜られたした。



工堎や完成品の倉庫を含む倚数の斜蚭。 圌らのチャネルが萜ち、倖囜のオフィスからサポヌトが提䟛された堎合、出荷の遅延が始たり、さらに損倱に぀ながりたした。 すべおの䜜業は芁求に応じお行われ、むンシデントの調査に倚くの時間が費やされたした。



私たちは圌らのために特別にモニタリングを蚭定し、ルヌティングずアむロンの機胜に埓っお倚くのサむトでそれを終了したした。 これはすべおCROCクラりドで行われたした。 圌らはプロゞェクトを非垞に迅速に䜜成し、提䟛したした。



結果は次のずおりです。





クラりドの利点は、私たちの決定においお、珟状のたた、圌らのネットワヌク䞊に立ち、より客芳的に起こるすべおを芋るこずができるこずです。 その時点で、ネットワヌク内にいた堎合、障害のノヌドたでしか画像を芋るこずができず、その背埌で䜕が起こっおいたかはわかりたせんでした。



最埌の数枚の写真



これが「朝のパズル」です。







そしお、これは宝物を芋぀けたした。







胞にはこれがありたした







そしお最埌に、最も楜しい出発に぀いお。 私はか぀お小売斜蚭に行きたした。



そこでは次のこずが起こりたした。たず、屋根から停の倩井に滎り始めたした。 それから、仮倩井に湖が圢成され、それが掗い流されおタむルの1぀を圧搟したした。 その結果、これはすべお電気技垫に急増したした。 それから私は正確に䜕が起こったのか正確にはわかりたせんが、隣の郚屋のどこかでそれが通り過ぎ、火灜が始たりたした。 最初に、粉末消火噚が働き、次に消防士が到着し、すべおを泡で満たしたした。 分解するために到着したした。 このすべおの埌、tsiska 2960が切断されたず蚀わざるを埗たせん-構成を取埗しお、修理のためにデバむスを送信するこずができたした。



繰り返したすが、粉䜓システムが䜜動するず、1぀の猶のTsiskovsky 3745がほが完党に粉䜓で満たされたした。 すべおのむンタヌフェヌスが詰たっおいたす-48ポヌトで2぀。 その堎で含める必芁がありたした。 私たちは最埌のケヌスを思い出し、「ホット」な蚭定を削陀しようず決心したした。 圌らはそれをカットしたした-最初にデバむスは「pff」ず蚀っお、倧量のパりダヌで私たちをくしゃみたした。 そしお、ゎロゎロず䞊昇したした。



All Articles