仕組み:データセンター「Berzarina」

画像



顧客(サーバールームにアクセスできる人も含む)は、データセンターで発生するすべてを見ることができません。 彼らの多くは、24時間365日の運用がどれだけスムーズにサポートされているかを知っているだけです。 今日は、モスクワにあるデータセンター「Berzarina」でそれがどのように行われるかを説明します。



画像



データセンターのフォールトトレランスは、運用に必要な2つのリソースを提供する重要なデバイスの機能を複製する追加の機器によって提供されます。配置された機器の電源と冷却です。



冷却



冷却システムと空調システムから話を始めましょう。 Berzarinaデータセンターでは、従来の「チラーファンコイル」運用方式を使用し、サーバールームを恒久的に冷却するUNIFLAIR精密(英語精度)エアコンを使用しています。



画像



これは、中央冷凍機(チラー)と空冷ユニット(ファンコイル)の間のクーラントが、比較的低い圧力で循環する冷却液(冷媒)である空調システムです。



画像

チラー


画像

ファンコイル


システムには、チラーとファンコイルに加えて、ポンプステーション(油圧モジュール)、自動制御サブシステム、およびそれらの間のパイプ配線が含まれます。 周囲温度とサーバールーム内の温度の差が最大になる夏季に最大の負荷がかかります。 1年の他の季節には、システムは「フリークーリング」テクノロジー(英語のフリークーリング)を使用します。これは、チラーへの負荷を最小限に抑えながら自然冷却のために低い周囲温度を使用します。 大企業は、データセンターでこのようなテクノロジーを積極的に使用しています。たとえば、Microsoftはアイルランド(ダブリン市)の涼しい気候にあるデータセンターで最大限にそれらを使用しています。 ここで非常に興味深い写真レポートを見ることができます



ポンプステーションは、システムの重要なコンポーネントです。 ポンプは24時間動作し、冷却装置からファンコイルに冷媒流を継続的に供給します。



画像



画像



冗長性は、システムが動作するために少なくとも2つのポンプが必要であることを意味します。 交代制で動作する3つのポンプが設置されています。 10時間ごとに、稼働中のポンプがオフになり、代わりにアイドルポンプが開始されます。



画像



これにより、動作時間が均一になり、ポンプの1つが故障しても、システムの動作に影響しません。 データセンターのシステムエンジニアは、毎日のラウンド中にポンプの状態をチェックし、パフォーマンスを監視する必要があります。 チラーのパフォーマンスを監視するために、冷却システム用の独立したハードウェアコントロールパネルを立ち上げ、24時間監視しています。



サーバールーム内に2つの気候ゾーンを形成する従来のサーバーキャビネットレイアウト構成を使用します。 2列のラックが互いの前にあります。 冷気は上げ床の下から来て、サーバーはそこからそれを取ります。 この気候帯は「寒冷回廊」と呼ばれます。 このゾーンの温度は+20±2°Cです。



画像



画像



サーバーの動作中に加熱された空気は、ラックの後ろのスペースに排出されます。ラックの後ろには、いわゆる「ホット」コリドーがあります。 冷却のために熱風を取り込むファンコイルが含まれています。



画像



「ホット」および「コールド」コリドー内の温度に関するオンライン情報は、30秒の更新間隔で24時間体制でデューティシステムエンジニアによって受信されます。



画像



温度が許容限度を超えると、アラームが鳴ります。 歩行中、エンジニアは非接触赤外線高温計で機器の温度を測定します。 クライアント機器が過熱していることがわかった場合は、すぐにクライアントに通知し、記録された温度を示します。



電源



ラックへの継続的な電力供給は、優先度の高いタスクの1つです。 3つの独立した入力がメインの電気パネルに適しています:異なる変電所から2つ、ディーゼル発電機から1つ。



画像



両方の入力は同期して動作します。それらの負荷は均等に分散されます。 それらの1つから停電が発生した場合、ABP(自動転送スイッチ)は負荷を瞬時に2番目のビームに転送し、ダウンタイムを解消します。



電気の供給が突然中断した場合(たとえば、都市の電力ネットワークでの重大な事故の結果)、General ElectricのUPS(無停電電源)のクラスターが自動的にアクティブになります。



画像



同じ瞬間、停電から3秒後に、ディーゼル発電機セット(DGU)を始動するコマンドが自動的に与えられます。 2分後、彼女は動作モードに入り、負荷全体がそれに切り替わります。 高性能のGesanディーゼルエンジンとVolvo Pentaエンジンを使用しています。 ピーク負荷モードでは、最大504 kWの電力を生成できるため、データセンターは必要な限り停止することなく動作します。標準の燃料供給で10時間十分であり、必要に応じていつでも燃料を補給できます。



画像



毎月、燃料、オイル、不凍液のレベルをチェックして、DGUのテストを開始しています。 テストは定期的に実行され、電源の完全な中断がシミュレートされ、ディーゼル発電機セットが自動的に開始され、負荷がそれに切り替えられます。 冬には、ディーゼルエンジンは夏よりも悪化する可能性があるため、事前始動ヒーターが装備されており、-30°Cでも始動できるように設計されています。



消火活動



たとえ最も信頼性の高い機器であっても、機器を使用する場合は、短絡や火災のリスクが常にあります。たとえば、コンポーネントが故障した場合などです。 そのため、すべてのデータセンターに自動消火システムが装備されています。 それは、機器を損傷することなく、火災を除去することが保証されるような方法で計算されます。 このためにガス消火システムを使用しています。



画像



その動作原理は、燃焼反応の化学的減速に基づいています。 システムは、ガス消火組成物(Freon-125)を部屋に届けます。 燃焼ゾーンに入ると、このガスは一次燃焼生成物と反応するフリーラジカルの形成により集中的に分解します。 この場合、燃焼速度が低下して完全に減衰します。



火災警報器の自動インストールは、火災を迅速に検出します。 消火剤の供給は、施設から人々を避難させるために遅れています。



画像



私たちの場合、システムは避難するのに30秒かかり、その後システムがトリガーされます。 偶発的な操作に対する保護も提供されます。システムは、少なくとも2つの火災検知器(センサー)が作動した場合にのみ消火します。



人を避難させる必要があります。ガスは部屋からほとんどの酸素を追い出し、視界は数十センチにまで低下します。 当社のエンジニアは、システム操作のイベントでのアクションのトレーニングを受けており、同様の状況での行動方法を知っています。



監視と対応



すべての機器は常に24時間監視されており、システムエンジニアは常に各デバイスのステータスをすばやく確認できます。 これにより、すべての障害および緊急事態に即座に対応できます。



画像



1日に数回、データセンターのすべての施設のラウンドが実施されます。 これらのラウンドでは、考えられるすべての欠点を特定し、それらについてすべての責任者に通知します。 これは主に、データセンターが予期せぬイベントに備えており、いつでも自律的に動作できることを宣言できます。



おわりに



データセンターの円滑な運用を確保することは、非常に重要な作業です。 ソリューションを成功させるために、障害の影響を受けるすべてのボトルネックは、追加の機器によって必ず確保されます。 定期的な検査と監視により、障害の推定原因をすぐに診断して防止できます。 古い機器を新しい機器にタイムリーに交換し、より高度な監視システムを開発し、それを制御するための柔軟なアプローチ-これらは毎日正常に解決されるタスクであり、お客様のデータとプロジェクトが確実に保護され、モードでアクセスできることを保証します24時間365日。



ここにコメントを投稿することができない読者は我々のブログで私たちに参加するのを歓迎しています。



All Articles