パート2。データセンターのエネルギー供給の監視はどうですか。
パート3. NORD-4データセンターの例を使用した冷凍供給の監視。
パート4.ネットワークインフラストラクチャ:物理的な機器。
データセンターでのエンジニアリングインフラストラクチャ監視システムの運用に関する一連の記事を続けています。 最初の部分では理論的なポイントを検証し、今日は実践に移ります。 最も重要なシステムであるエネルギー供給から始めましょう。 読む前に、データセンターの電源装置に関する知識を更新することをお勧めします。
OST-2データセンターのエネルギー供給システムを監視するためのスキームの1つ。
電源システムの監視機能
エネルギー監視には独自のニュアンスがあります。 ここでは、システムを設計およびカスタマイズしようとしている人向けの一般的なヒントを紹介します。
可能なすべてを監視します。 電源システムに重要でないセクションはありません。 変圧器からラック内のPDUまで、システムの各要素の主要なパラメーターを追跡します。
システム全体を監視します。 すべての機器を監視下に置くだけでは十分ではありません。 システムのすべての要素間の既存の関係を反映することが重要です。 これにより、問題をより迅速に診断でき、多数のエラーアラートで混乱することはありません。
回路図、カード、およびその他の視覚化は、これらの目的に最適です。 投稿の冒頭の写真はそのようなスキームのほんの一例です。 ラックで電力が失われた場合、そのようなスキームを使用すると、事故の原因を理解しやすくなります。
可能な限り頻繁に機器にインタビューします。 頻繁に調査することで、エネルギー供給システムの寿命の中で重要なイベントを見逃さないようになります。都市の電源を切る、電源ステーションを起動できなかったエラーなどです。 メインスイッチボード、ディーゼル発電機セット、UPSなどの重要なノードを毎秒調べることをお勧めします。
フェーズバランシングとペアロードを監視します 。 これらは、エネルギー供給システムの派生指標です。 これらは、機器から受信した情報に基づいて監視システムで直接計算されます。
統計を収集します。 オンラインデータとアラートのみが少なく、長期的な統計を収集する必要があります。 キャパシティ管理からスペアパーツの購入予算の計算まで、多くのことに役立ちます。
私たちの監視について一言
システムは、 Nagiosオープンソースソリューションで実行されます。 機器のパラメータ値を収集し、しきい値に達するとアラートを送信します。 合計で、8台のNagiosスタンドが展開されています。
7つのデータセンターとすべての監視システムに関する情報は、 Thrukに基づく単一のインターフェースで収集されます。
Thruk Webインターフェース 。
組み込みのサービスNagiosとCactiを使用して、それに基づいて統計とグラフを作成します。
情報を表示する別の方法は、回路図を使用することです。 この調整プロセスは、大量のデータの認識を構造化し、簡素化します。 完全な画像は、モニターで一目で取得できます。
NORD-4データセンターのエネルギーセンターと機械室を監視するためのスキーム。
何を、どのように、どの機器で追跡できるかを見てみましょう。
変圧器
高負荷では、変圧器が加熱します。 過熱が発生すると、保護が作動し、トランスがオフになります。 監視のおかげで、時間通りに過熱を追跡し、必要な措置を取ることができます。
トランスがまだ動作していない場合、熱電パイロメーターをハウジングに取り付けることができます。 既存の変圧器ではすでにリモート赤外線高温計を使用しています。
これが赤外線高温計の外観です。
メインスイッチボードの入力
システムのこの部分を監視すると、都市からの電力の可用性と、電流と電圧に関するその特性に関する情報が得られます。
各変圧器から、3つの銅製バスバーが主配電盤(MDB)に到達します。 電流および電圧データを取得するために、各バスに変流器が設置されています。 その一次巻線はバスに接続され、二次巻線は測定デバイス- ネットワークアナライザーに近接しています。
同様に、変流器はディーゼル発電機セットの配電盤内のバスに取り付けられています。
銅製タイヤの黒いリングは変流器です。
ネットワークアナライザーは配電盤のドアに取り付けられています。
監視システムは、ModBusプロトコルを使用してネットワークアナライザーをポーリングします。 データは監視サーバーに送信され、単一のThruk Webインターフェイスに表示されます。
ネットワークアナライザーと監視システムの接続図。
同様に、監視は残りの配電盤(SC)に配置されます。 各アナライザーセクションには独自のアナライザーがインストールされており、AL全体に対してトータルアナライザーがインストールされています。
エンジンルームの配電盤の変流器。
機械室の配電盤内のネットワークアナライザー。
ネットワークアナライザーから約20のパラメーターを取得します。 主なものは次のとおりです。
- 相電流;
- 線間および相電圧;
- 頻度
- 電源がアクティブ、リアクティブ、フル。
監視システムのメインスイッチボードのいくつかのパラメーター。
メインスイッチボードに応じたすべての主要なパラメータは、回路図に表示されます。
保証された電源
このシステムによれば、DGUシールド、燃料タンク、そしてもちろんDGU自体の状態を監視します。 監視システムは、DGUコントロールパネルからディーゼル発電所からデータを受け取ります。
DGUコントロールパネル。
監視システムへのディーゼル発電機セットの接続図。
DGUの主なパラメーター:
- 状態:自動モード、動作中。
- 1分あたりのエンジン回転数。
- 作品のエラーの存在。
ディーゼル発電機セットのタンク内の燃料レベルを監視し、H時間に燃料が残されないようにしてください。多くのタンクの構成には、視覚的な監視にのみ適した機械的な燃料レベルセンサーが既に含まれています:タンクに行って、残量を確認する必要があります。 これもオプションですが、人的要因を取り除き、プロセスを自動化するには、デジタルセンサーを使用します。
監視システムに設定されているディーゼル発電機の主なパラメーターのリスト。
途切れない電源
UPSにリモートモニタリング用のモジュールがある場合、データ収集は難しくありません。SNMPプロトコルを使用して無停電システムのポーリングを設定するだけです。
内部のUPS。 監視サーバーに接続する監視モジュールは赤でマークされています。
主な追跡パラメーター:
- 動作モード:都市/ DGUからの電力、バッテリー電力、バイパス動作。
- UPSの入力および出力での電圧と電流。
- UPS内部温度。
通常、UPSはバッテリー(バッテリー)のパラメーターも監視できます。
- バッテリー電圧;
- バッテリーレベル;
- バッテリー寿命の推定。
- バッテリー温度。
監視システムのUPSパラメータ。
ラックPDUおよびATSモニタリング
PDU監視を使用すると、機器のあるラック内の1つまたは複数のビームの電源障害を記録できます。 これを行うには、SNMPを介してポーリングする機能を持つPDUを使用するだけで十分です。 管理および特殊なソフトウェアを備えたPDUも可能ですが、この場合は別のインターフェイスが追加されます。
ラックマウントABPの監視にも同じことが当てはまります。
PDUを監視システムに接続します。
派生パラメーター:位相およびビームの負荷分散
配電盤のネットワークアナライザー、UPS監視モジュール、PDUから受信したデータに基づいて、いくつかの派生パラメーターが監視システムで計算されます。
フェーズロード。 負荷が各フェーズに均等に分散されている場合、ケーブルとマシンの電力が効率的に使用されます。 1つまたは2つのフェーズに過負荷がかかり、1つまたは2つのフェーズに過負荷がかかると、いわゆる位相不均衡が発生します。 少なくとも、これは使用可能な容量が最適に使用されていないことを意味します。 最悪の場合、これによりマシンの電源が切れ、ケーブルが過熱します。
監視システムの相負荷
2つの梁の対荷重。 データセンターでは、電源システムの予備は2Nです。
各ラックには、2つの独立した電源ビームが付属しています。 そして、栄養光線の1つに何かが起こった場合、もう1つは失敗した人の負担になります。 各ビームには定格電力の半分のみをロードする必要があることがわかりました。 この場合にのみ、動作中のビームは二重荷重に耐えます。
これを行うには、1つのビームの負荷が公称値の50%を超えないようにし、2つのビームの合計負荷が公称値の100%を超えないようにします。
このパラメーターを追跡しない場合、ペア負荷がマシンの定格電力を超えているため、2番目のビーム用の予備がない場合に状況を「点滅」させることができます。
両方の原則を同時に尊重する必要があります。 これを実際に検討してください。 フェーズごとに32 Aの三相電源を備えたラックがあるとします。 機器は2つのPDUに接続します。 各PDUには3つのセクション(B1、B2、B3)があり、各セクションはフェーズに対応しています。 3フェーズPDUを扱っています。 上記の規則に従うと、2つのビームの合計負荷は32 A未満であることがわかります(下図を参照)。
すべてが明らかなようですが、そのような場合を見てみましょう。 同じラックに機器を接続します(下図を参照)。 19.5 kW(それぞれ6.5 kWの3つのセクション)のうち11 kWしかなく、平和に眠ることができるようです。 しかし、ある時点で1つのビームがオフになり、ラック全体に電力が供給されなくなります。 次のことが起こりました。 光線の1つで最初のセクション(フェーズ)をオーバーロードしました。 総荷重は公称値を超えていました。 ビームの1つがこの過剰な負荷を引き継いだとき、機械はノックアウトしました。
監視システムのPDU(B1)の最初のセクションのペアの負荷。
そのため、ペア負荷はラックレベルで測定されます。 同じ原則に従います。
- 機械室の配電盤のセクションでのペアの負荷;
- ASR全体のペアの負荷。
- UPSのペアの負荷。
監視システムのUPSのペアの負荷。
これについて詳しく見てみましょう。 コメントで質問してください。 ラックまたは配電盤の負荷分散について質問がある場合は、コメント、PM、またはconsulting@dtln.ruに記入してください。
次の記事では、 冷気供給の監視について説明します。
データセンターでの監視とエネルギー供給に関するその他の記事:
パート1.データセンターのエンジニアリングインフラストラクチャの監視。 ハイライト
データセンターの電気の道
データセンターでDGUをテストする方法