最南端のデータセンター

会話の中で「南」という言葉を聞くと、私たちの意識は日当たりの良い絵画、塩気のあるそよ風、海鳥の群れ、ヤシの木を思わず描きます。 この記事では、世界最南端のデータセンターについて説明しますが、季節的な太陽の豊富さにもかかわらず、ここではビキニを着て歩くリゾートは見つかりません。 南緯89度59分24秒に位置するアムンセン-スコタ極ステーションでは、アイスキューブデータセンターが作成され、ニュートリノ天文台をサポートするために正常に運用されています。 このITノードのタスクと、機器の操作性を維持する必要がある条件については、この記事の後半で説明します。







アイスキューブ研究所のデータセンターには、1,200を超えるコアと約3ペタバイトのメモリがあります。 実際、データセンターの全コンピューティングの可能性は、地球の最南端に位置するニュートリノ天文台のニーズを満たすことを目的としています。 ニュートリノ検出器は、1キロメートル以上の南極の氷の下に列状に積み上げられており、そのタスクは、大規模な破壊イベントのエコーで深宇宙からやってくるニュートリノ放射のバーストを捕捉することですニュートリノ。







地球上で最も過酷で最も遠隔地の1つでITインフラストラクチャの運用状態を起動および維持するプロセスは、ITエンジニアがまだ遭遇していない多くの問題とテストによって特徴付けられました。



アムンセン-スコット極地駅への道の複雑さは、別の惑星への旅と比較することができます。「これは、白と青の2色だけが支配する世界です」とGitt駅の従業員は言います。 「夏には、1日の2時間はここで何日間も続くと思うので、それ自体が通常の人間のライフサイクルの知覚に新しい非常に興味深い感覚をもたらします」とGittの同僚、バーネットは言います。 同時に、この地域の冬は、月とまれな現象であるカラフルなオーロラ(オーロラ)だけに照らされる長い夜が特徴です。







スタッフ



合計で、駅に滞在するのは150人以下で、その中でITスペシャリストが占める割合はごくわずかです。 専門家の仕事は、彼らのほとんどが駅で冬を過ごさないように設計されており、データセンターにサービスを提供するWIPAC ITチーム(ウィスコンシンIceCube粒子天体物理学センター)は、数ヶ月の氷の層で覆われた土地にあり、夏季のみです。 短い極地の夏の間、技術者はすべての計画を達成し、その後、彼らは白い大陸を去ります。







残りの年、駅のインフラストラクチャはウィスコンシン大学からリモートで管理されます。 冬に残るITチームの部分は、通常、知的能力の点ではなく、物理的なものの点で選ばれます。 「越冬する従業員が学ぶ必要がある主なスキルは、衛星電話を使用する能力です」と、ポーラーステーションのIT機器の管理者であるRalf Auerは冗談を言います。 「緊急事態が発生した場合、私たちの仕事はできるだけ多くの情報を収集し、問題をリモートで解決することです」とラルフは笑いながら言います。



「越冬チームは、データセンター機器を稼働状態に維持するための複雑な作業の「鉄」コンポーネントを担当していますが、日常のITワーカーもそれらをバイパスしません」とBarnet氏は言います。 このようなデバッグされたシステムの結果、Auer、Barnet、および他のチームメンバーは、機器から離れて彼に何が起こっているかを完全に理解することができます。 データを分析した後、越冬チームのメンバーは、実行する必要があるアクションの明確なガイドラインを取得します。 「これはすべて、無線室からの経験豊富な航空管制官が飛行機の飛行を制御する状況と比較することができます。機内では客室乗務員のみがチームから残りました」とバーネットは皮肉を込めて指摘します。 上記のように、南極の冬の間に大学のスタッフがすでに困難な滞在を簡素化するために、データセンターを維持するための主な作業は離れて行われ、これは利用可能なすべての通信チャネルを通じて行われます。



「緊急の場合、ポーラーステーションはIT専門家から追加のサポートを受けることもありますが、これらの人々はもはや大学の従業員ではありません。 夏のピーク時には、駅での大学の従業員の活動は5〜8人、冬は4〜5人です」とGitt氏は言います。 「極地観測所の主要なサポート拠点であるマクマード駅から支援を受けることができます。 夏季のピーク時には、さまざまなプロジェクトに最大35〜40人の科学者が関与する可能性があります。







コミュニケーション



天文台から文明までの距離で利用可能な最も信頼できる通信チャネルは、衛星インターネットでした。 イリジウム衛星ネットワークは、このような重い責任の負担がかかっている接続スレッドになっています。 このような接続のデータ転送速度は、わずか2400ビット/秒です。 データ転送プロセスは非常に最適化されており、Iridiumシステムとの多重接続を含む最大数の接続が衛星で予約されており、送信された情報の最適な圧縮技術によりその量が最小限に抑えられています。







「極地データセンターとの通信スレッドには、トラクターに取り付けられた通常のスレッドが使用される場合があります。 慎重に梱包された情報キャリアは、当社のサポート拠点に輸送されます」とGitt氏は言います。Gittは、冷凍大陸に敷設されているセキュリティキャラバンの編成に繰り返し参加しています。



世界中のネットワークへの最も高速なアクセスは、NASAが提供するシステム-追跡およびデータ中継衛星システム(TDRSS)です。 その中のデータ転送速度は150 Mbpsです。 この通信チャネルの主な問題は、1日の部分的な可用性のみであり、わずか10時間です。 また、1978年に打ち上げられた元の気象衛星も8時間南極点にありますが、そのデータレートはわずか1 Mbit / sです。



データセンターに物理的にアクセスできない



駅への人員の配達と人員の寿命の確保は、最も困難な作業の1つです。 「考慮しなければならない詳細は、ステーションを閉鎖できることです。さらに、気候条件により、3月から10月までは物理的にアクセスできません」とバーネットは言います。 -「インフラストラクチャが正常に機能するために必要な作業は、11月から1月までしか行えません。 そして、これには完璧な物流計画が必要です。 極地の夏でさえ、天気の要素はそれらの場所にとって常に重要であり、ITインフラストラクチャを最適化および分岐するための最高の計画を持っている場合でも、吹雪の終わりを待つ椅子に座ります。必要な貨物を届けることができないからです。



データセンターのあるアムンセンスコット駅にある展望台は、15,000 kmの供給ルートの最終地点として機能します。 米国からステーションに送られたものはすべてクライストチャーチ(ニュージーランド)に到着し、その後、氷上に着陸するために特別に装備されたS-17航空機に搭載され、マクマード極地ステーションへの道が開かれます。 駅では、装備がスキーシャーシとロケット推進加速器を特別に装備したLC-130航空機に移されており、最後の1250キロメートルはすでにカバーされています。







この文明からのデータセンターの削除の結果は、在庫のスペアパーツを常に十分に確保する必要があることでした。 「ハードドライブに障害が発生した場合、またはネットワークカードが応答しなくなった場合、新しいユニットが「大地」から1〜2週間で配達されるという保証はありません。そのため、ステーションの予備はITインフラストラクチャ全体の機能に不可欠です」バーネットは強調した。



「夏季の極地ステーションでの故障した機器の標準納期は30日間ですが、そのような日付でさえ常に満たされるとはほど遠いです」とバーネットは言いました。



サーバーラックの熱放散の問題



ポールでサーバーを冷却しても問題はないはずですが、そこにも神に感謝します。 地球上で最も寒い場所での冷却は、本当に大きな問題です。 「このような過酷な状況では、サーバーラックから熱を除去するためにシステムを操作するとき、非常に注意する必要があります」とGitt氏は言います。 「冷たい空気の取り込みは、環境から直接発生します。 システムのデータセンターを冷却する換気システムのゲートを開けることができず、完全に氷で覆われていた日がありました。 空調システムははるかに低い温度で動作するように設計されている一方で、他の状況では、環境が暑すぎるため、機器が過熱する可能性があります。







「150台の車は非常に多くの熱を発生させます。それを取り除くために、通りの広いドアを開けるだけでは、大きな温度低下から数分で機器が故障します。」



これを防ぐには、データセンターの温度制御を非常に柔軟にする必要があります。 このような緯度の換気システムの既製のソリューションを得るのは不可能であり、設計者が自らの危険とリスクで行った多くのことであり、システムがインストールされた後、繰り返し改訂されました。 最も予期しない方向に多くの問題がありました。 「ラック内のサーバーの一部をより小さなサーバーと交換した後、機器を冷却する空気の流れが変化したため、すべてのラックの位置をわずかに変更する必要がありました」とバーネット氏は言います。



+18摂氏の部屋に入るには、外部が-40から-75に激変する可能性があるため、一生懸命努力する必要があります。 「アイスキューバ」チームは、空気取り入れ口から流入する空気の量を制御することで部屋への空気供給を管理します。これは定期的に凍結し、データセンターの従業員に大きな問題を引き起こします。







南極大陸-極値の大陸



極南極の条件でのデータセンターの機能における別の困難は、湿度、またはむしろその不在でした。 南極の空気は非常に乾燥しており、気温が低く、最も近い海岸からほぼ1000キロメートル離れた基地から離れているため、この効果が生じました。 乾燥した空気は人々に悪影響を与えるだけでなく、機器に常に良い影響を与えるとは限りません。 フィルムメディアにとって、乾燥空気は真の災害になりました。 ボードの絶縁部分の過度の激しい摩耗によるネットワーク機器の故障の後、一部の部屋の空気を特別に湿らせることが決定されました。 駅で勤務中の従業員のレビューによると、これは状況をより良く変えた。



データセンターの別の問題は、エネルギー供給でした。 南極に発電所はなく、送電線は重複していません。 Polarデータセンターの従業員が操作できるのは2台の発電機だけであり、データセンターに電力を供給することに加えて、ベース全体に電力を供給するため、追加のリスクが伴います。 ジェネレーターの切り替えには時間がかかります。 そして、この時間を予測することは非常に困難です。



あらゆる段階でのデータセンターの機能の問題。 少なくとも夏のシーズンでも、データセンターの敷地へのアクセスが物理的に常に可能であるとは限らないという事実。 サーバールームは、ポーラーステーションの独立した建物であり、住宅のモジュールからそこに到達するには、道路に沿って短い距離を克服する必要があり、環境条件が常にこれを許可するわけではなく、従業員は天候が改善するまで数日待つ必要があります。







しかし、ステーションで働く人々が毎日直面するすべての困難にもかかわらず、そしておそらく彼らのおかげでさえ、Ice CubeチームのAuerとBarnetのメンバーは、最南端のデータセンターの操作性を確保する彼らの仕事は本当にクールだと思います。 「ITに精通している人に、約150台のサーバーがある南極にデータセンターを立ち上げようとすると、後者の稼働時間は99.5%に維持されますが、それはすばらしいことです」とAuer氏は述べました。



All Articles