データセンターの運用での書き込みについて

「データセンターのエンジニアリングインフラストラクチャの管理」コースのちょうど半分を完了しました。 ほぼすべてのセミナーで特定のトピックが話題に上ったので、夏のデータセンターの準備、請負業者との共同作業、または独自の運用サービスの構築についてリスナーに話しました。 私たちは、経験から最も切迫したトピックと推奨事項に関する小さなガイドをまとめることにしました。











機器のマーキング



このトピックは、セミナーでの言及の記録保持者です。 ラベル付けについては、次のことを知っておく必要があります。



  1. マーキングシステムは、データセンターまたはサーバーの設計段階で運用サービスと考えられ、合意されています。 設計者と建築者がメンテナンスサービスに理解できない独自のラベル付けの原則を持っている場合、エンジニアはこの遺産全体を解読するか、すべてを理解可能な座標系で再度マークする必要があります。



  2. すべてのシステムのすべての要素にマークを付ける必要があります。 エアコン、チラー、UPSには独自の番号が必要なだけでなく、各マシン、バルブ、ビデオカメラも必要です。 多くの場合、ケーブル線、クロスオーバーは識別マークなしで残ります。 「一時的な避難所」に特別な注意を払ってください-彼らはまたマークされなければなりません。



  3. ラベル付けの原則は、すべてのエンジニアが透明かつ理解できるものでなければなりません。 たとえば、暗号の最初の数字はデータセンターを示し、2番目はホール、3番目は行、4番目はラック番号を示します。 次に、ラック5H3C030がデータセンター5のエンジンルームH3の行030の下にあることがわかります。



    配電盤の場合、原則は配電盤の種類、ホール、ビーム、配電盤番号です。 次に、エンジニアは、2.2.1が2番目のホールの2番目のビームから給電される配電盤番号1であることを理解します。



  4. エンジニアが機器を簡単に識別できるように、マーキングは目に見えて読みやすいものでなければなりません。 より明確にするために、色を使用します。 ここでは、たとえば、「ズボンの色の区別」を使用して、冷気供給システムの供給ビームとパイプをマークします。



  5. ラベリングは最新でなければなりません。 機器が別の部屋に移動した場合、レイアウトが変更されます。これをすべてマーキングに反映することを忘れないでください。




コールドサプライNORD-4の水回路のパイプラインのマーキング。 各パイプには、番号、流れの方向、水温(温かい、または冷たい)のマークが付いています。



モニタリング



あらゆる規模のデータセンターまたはサーバールームは、監視システムなしでは運用および保守が困難です。 監視なし-情報なし。つまり、データセンターまたはサーバーを盲目的に管理する必要があります。



紳士用監視キットの推奨事項は次のとおりです。 追跡:



  1. エンジニアリング機器の状態(オン、オフ、エラーがある場合):都市からの入力、ディーゼル発電機セット、UPS、バッテリー充電レベル、UPSのバッテリー寿命、ディーゼル発電機セットの燃料レベル。



  2. SLAに表示されるインジケータは、温度、エアコンの湿度、UPSの電圧と電流です。


最小限のプログラムが完了したら、オプションで以下を追加できます。





80番目の監視レベルでは、機器内の要素の動作がすでに監視されています。 たとえば、室外機のファンがどの速度で回転するか、フレオンシステム内の圧力、または現在ロードされているチラー内のコンプレッサーが何パーセントであるかなどです。 将来的には、潜在的な問題を追跡し、さまざまな条件でシステムの動作を分析するために、機器の予備があるかどうか(その容量の100%で機能しないかどうか)を理解するのに役立ちます。



多数の監視対象パラメータは、まだ監視作業の品質の指標ではありません。 すべてを適切に構成する必要もあります。 基本的な契約は次のとおりです。



  1. システムごとに異なるポーリング時間を設定します。 空調には1分で十分であり、エネルギーの供給には1分でも稀です。 この間、ビームが落ち、バッテリーへの切り替えが機能せず、ディーゼルエンジンが始動しない場合があります。 そのため、可能な限り頻繁に電源装置からデータを削除します。 たとえば、1秒ごとに測定値を取得します。



  2. 画面上の主な監視インジケータを視覚化して、常に見えるようにします。 数字のあるテーブルからよりも、チャートやグラフから情報を抽出する方が簡単です。 ただし、画面を過負荷にしないでください。そうしないと、可視性が失われます。



  3. アラートがトリガーされるまでの重要な値を書き留めます。 警告(警告)と重大なエラー(アラーム)の2つのレベルの警告を提供することをお勧めします。



  4. データを最新の状態に保ちます。 アラートの画面では、「期限切れ」アラームがハングしないはずです。 このような状況は、監視システムで事故に関する警告がトリガーされたときに発生する可能性があります。 事故が発生した後、事故のステータスを「進行中」に変更することを忘れないでください。 したがって、新しいアラームは古いアラームの間で失われません。 必要に応じて、アラートとアラームのメールとSMSアラートを構成できます。




監視システムのNORD-3データセンターの概略図により、エネルギーセンターの状態、機械室の寒い廊下の温度をすばやく評価できます。





オンデューティエンジニアは、制御および監視センターでNORD-3の作業を監視します。



これは完全にオプションですが、私たちは商業データセンターであるため、すべての主要な指標を個人アカウントとDL Monitorモバイルアプリケーションにブロードキャストするようにクライアントを構成しました。



統計収集



すべてのパラメーターは、リアルタイムで観察するだけでなく、それらの統計を収集する必要もあります。 将来的には、ライフサイクル中の機器の動作、修理が必要な頻度、および電力に余裕があるかどうかをよりよく理解するのに役立ちます。 これにより、メンテナンスの頻度を計画し、必要なスペア部品の数を見積もり、 機器の購入とメンテナンスの予算を確立するのに役立ちます。



どのように機能しますか? たとえば、空調に関する長期的な統計情報と気象条件に関する情報があります(気象ステーションは各サイトで機能します)。 昨夏の冷却システムが+32°Cでどのように機能したかを追跡できます。 暑い夏が予想される場合、冷却システムにパワーリザーブがあるかどうか、または何らかの形で強化する必要があるかどうかを評価できます。 また、故障と修理の履歴から、どのスペアパーツが必要になる可能性が最も高いかを予測できます。



このような統計を維持するために、特別なプログラムは必要ありません。 唯一のアドバイス:グラフを作成できる監視システムを使用する方が便利です。 情報がグラフ形式で表示されることを意味しない場合(たとえば、インシデント、修理、事故、保守の内容)、通常のExcelにデータを入力できます。



DGUのサマリーテーブルは次のようになります。 契約、保証サービス、メンテナンススケジュール、修理、テストの開始および指示に関する情報へのアクティブなリンクを配置すると、特定のディーゼル発電機に関するすべての情報が常に手元にあります。







スペアパーツと消耗品



スペアパーツと消耗品は常に手元にある必要があります。 サーバーの近くに保存できる場合は、これが理想的です。 倉庫のスペースが限られている場合、請負業者に要求に応じてスペアパーツの保管と提供を委託することができます。



緊急修理のためにスペアパーツと消耗品を用意しておく必要があるもの:





データセンターが必要な予備力なしに留まらないように、長時間稼働するスペアパーツ(コンプレッサー、コントローラー、メイン配電盤のメインサーキットブレーカー)が利用可能でなければなりません。





空調用の倉庫スペアパーツ。



ラックマウント



機器の正しい設置については別のレッスンがありましたが、ほとんどすべてのセミナーでよくある間違いについて覚えています。 なんで? すべてがシンプルです。 ラックに不適切に設置されたサーバーは、適切な運用サービスを備えた適切に設計されたデータセンターでも、ローカルの問題を引き起こす可能性があります。



主な間違いは次のとおりです。



  1. 2つの電源を備えたIT機器は1つのPDUに接続されます。
  2. 1つの電源を備えた機器は、自動転送スイッチなしで接続されます。
  3. 機器は隣接するラックに接続されます。
  4. 過負荷のPDUセクション。
  5. 機器は、熱い廊下に「顔を合わせて」設置されます。
  6. 自由なユニットに漂遊熱伝達を防ぐプラグはありません。




1つと2つの電源を備えたサーバーの正しい接続スキーム。



これで、メンテナンスエンジニア向けの燃焼トピックのヒットパレードは終了です。 コメントであなたの意見を共有し、質問してください。 次回のセミナーでは、データセンターのエンジニアリングシステムをテストする方法と、監視システムを構築する方法についてお話します。



データセンターの設計と運用に関するその他の記事:



» データセンターNORD-4の冷却システムの作成方法

» 運用段階でのみ発生するデータセンターの設計のエラー

» データセンターの電気の経路

» ロシア最大のデータセンターへの遠足



All Articles