こんにちは、カブロビテス!
これは、MTSの企業ブログです。 ここでは、コミュニケーションとテクノロジーの専門家がすべての楽しみについて書いています。 MTSのコンバージドネットワークおよびサービス部門のディレクターであるAndrey Sereginから始めましょう。 Andrey Vyacheslavovichに一言。
良い一日! 最後に、私の手はHabrのテキストに到達しました。
私の経験をプロで興味のある聴衆と共有したいです。 4年前、MTSは、国内で初めてクラスノダールにあるモバイルネットワークの運用管理の統合センターを開設しました。 昨年11月、ニジニノヴゴロドにUnified Fixed Network Management Centerを正式にオープンしました。 したがって、すべてのネットワーク(モバイルおよび固定)の監視と管理の集中化が完了しました。 そして、これはロシアの通信事業者の間でこのような規模を中央集権化した最初の経験です。
あなた自身についてのいくつかの言葉。 私はモスクワ電子技術大学のマイクロデバイスと技術サイバネティックス科を卒業しました。 私の専門は無線工学装置であり、MTSで21年間を含む27年間この分野で喜んで仕事をしてきました。MTSでは、緊急修理チームの従業員、コントロールセンターのオペレーター、最終的に運用マネージャーになりました。 職場では、はんだごてでトランシーバーやコンピューターに「登り」、さまざまな言語でプログラミングし、70メートルの通信塔に登り、大規模なチームを管理して、いくつかのMBAプログラムを完了する必要がありました。 しかし、私は自分がコミュニケーションエンジニアであることを常に誇りに思っており、いつでもネットワークの技術的な詳細に没頭できることを嬉しく思っています。
最初の紹介記事では、独自のセンターを使用してネットワークの運用を制御し、緊急事態を迅速に排除する方法について説明します。
ネットワークの監視方法
既に理解しているように、単一のネットワーク管理センターのタスクは、ネットワークの動作を監視し、ネットワーク上の緊急事態とスケジュールされたアクティビティの排除を管理することです。 センターが2つあるため、当社の部門は現在、モバイルネットワークと固定ネットワークの両方を完全に担当しています。 「固定」および「モバイル」ネットワークの概念は条件付きになりました(統合ネットワークを収束と呼び、加入者に収束サービスを提供します)。 たとえば、大企業のクライアントをブロードバンドアクセスに接続する必要があります。 そして彼のオフィスでは、4Gベースステーションが「輝いています」。 この場合、多くの場合、アクセスは基地局を介してネットワークに転送されます。 つまり、オフィスには4Gステーションから信号を受信する通常のモデムがあります。 次は、内部ブロードバンドネットワークです。 したがって、一方では、モバイルネットワークを介して固定アクセスを提供します。 また、逆に、この光回線を介して固定アクセスサービスを提供するために光回線を構築した施設で新しい基地局をオンにすることもあります。
そのため、地理的多様性を利用して生存率を向上させ、2つのセンターを1つとして認識しています。 私たちにとって重要なことは、モバイルと固定ネットワークの管理は同じ手にあり、以前のように異なる構造や異なるレベルではないことです。
ネットワークの問題を解決する方法
Operations Management Centerには、包括的な監視システムがあります。 ネットワーク機器の動作の不具合または動作条件の変更に関するメッセージは、全国の運用担当役員のモニターに届きます。 運用責任者は、メッセージを読んだ後、機器へのリモートアクセスを使用して15分以内に自分で問題を解決するか、その場でエンジニアにインシデントを割り当てて解決する必要があります。 指定されたインシデントの解決の進捗は厳密に管理されています。
統計によると、基地局の問題の最も一般的な原因は、外部電源の切断です。 外部電源がオフになると、ステーションは自動的に切り替わり、数時間動作するように設計されたバッテリーで動作します。 さらに、原則として、外部電源は非常に迅速に復元されます。 つまり、緊急事態は自動的に解決され、それに対応する必要はありません。 したがって、急いでそのようなメッセージに応答することは必ずしも正当ではありません。 基地局が外部電源の不足を「抵抗」する能力を待機し、評価し、エンジニアを温床から引きずって発電機とともに基地局に送ることは価値があります。 さらに、私たちの経験では、この作業をロボットに任せることができ、人をつなぐかどうかは間違いなく決定することが示されています。
多くの場合、勤務担当者は複数のアラームメッセージを一度にすばやく分析し、1つにグループ化する必要があります。 たとえば、特定の場所に3つの基地局を建設しました。 それらは無線中継線で相互接続されています(衛星放送のような2つの料理は、お互いを見て、基地局を接続します)。 1つの「リレー」に障害が発生すると、その背後にあるベースステーションのチェーン全体が、予備がない場合は機能せず、いくつかのベースステーションの障害に関するメッセージがデューティオペレータに送信されます。 別の「スパン」を修復する必要がある場合、すべてのステーションでインシデントを開始するのは愚かなことです。 このようなアラームメッセージは自動的に1つのメッセージに「崩壊」する可能性がありますが、プログラムで設定することが不可能な場合は、職務担当者が行う必要があります。 これはすべて、アラーム相関と呼ばれます。
クラッシュの90%はコントロールセンターからリモートで排除されます。これは、当社のインフラストラクチャのほとんどすべてがコンピューター上に構築されているためです。 しかし、手で何かを修正し、ボードを物理的に変更し、アンテナを修正する必要がある場合は、フィールドチームが送られます。 また、彼らの仕事を整理する責任もあります。 各地域には2つまたは3つの旅団があり、短時間で目的地に着くことができます。 旅団の範囲は400 kmに達します。
1日に多くのアラームがありますか?
1日に何千ものアラームがモニターのオンラインデューティに送信されています。 インシデントは、12時間シフトごとに800〜900のオーダーで記録されます。 4年前、メッセージは5秒ごとにオペレーターに送信され、シフトごとに1200件のインシデントが記録されました。 今では多くのことを自動化し、メッセージの分析を改善し、「インシデント」を作成するプロセスを部分的に自動化しました。 これにより、はるかに多くの機器を制御できます。
緊急事態は顧客に影響しますか?
「インシデント」が発生した場合、顧客サービスの違反を直接評価することは困難です。 そして、ここに理由があります。 モスクワで想像すると、基地局はほぼ200メートルごとです。 また、監視モードで電話をオンにすると、特定の場所で複数のベースステーションの信号を一度にキャッチすることがわかります。 1つのベースステーションがオフになっても、静かに電話をかけたり、SMSを送信したり、インターネットを使用したりできます。 しかし、私たちにとってはまだ事件です。 そして、すぐに解決します。 実際、純粋に理論的には、クライアントの1人がシールドウィンドウを備えたオフィスにいて、特定の最も近いステーションのみが「到達」します(この「鉄の箱」に侵入すると信号が1000倍弱くなるため)。
ただし、1つのベースステーションの電源を切ったときにネットワークフラグメントの全体的なトラフィックを調べても、変化はありません。 他のステーション間で再配布されます。 このような状況で顧客サービスを中断することについて話すことは、少なくとも間違っています。 このような状況でどれだけの損害が発生し、サービスが損害を受けたかを厳密に計算できる単一の会社の世界では、私は知りません。
だから、一般的に言えば、私が専門的に行うことは次のように見える。 次の投稿で何を話してほしいですか?