データセンターの輸送方法(中央レーンでのデータセンターの移行の難しさ)



2つのサーバーとオフィスからの通信を移動および結合した結果



データセンターを新しい場所に移動する必要がある場合があります。 理由は大きく異なります。 たとえば、内部にデータセンターがある大規模なオフィスを移動する場合。 または、地域からモスクワまでのロシアの大企業のサーバールームを収集します。 または、ここに楽しいケースがあります-2つのデータセンターを1つに統合する必要がある場合の銀行連合。



私は個人的に7つの再配置に参加しましたが、私たちのチームは既に30個以上の大きなオブジェクトをドラッグしています。 したがって、倒錯について多くのことを知っています。



IT機器の移動は、土曜日の夜にすべてを別の場所に移動することができないという点で、従来の移動とは異なります。 問題は、24時間体制でダウンタイムなしにITサービスが必要なことです。 さらに、一時的なネットワークインフラストラクチャと新しいネットワークインフラストラクチャには多くのニュアンスがあります。古いサーバーでハードドライブを輸送し、オフィスの窓からクレーンで2トンのデータストレージシステムを引き出し、到着後、ドアを開けてカーペットを敷きます。



1.素晴らしい準備



最初に、顧客が来て、「私は連れて行く必要があります。」と言います。 顧客は、原則として、すでにオフィスまたは小さなサーバールームを輸送している大企業です。 したがって、一般的に、考えられる問題の規模と概算の概要を示します。 この段階での主な要件は、すべてのことをスムーズに、落ち着いて、後でどのバイクが話すかを状況なしで行うことです。 つまり、可能な限り退屈で予測可能です。



最初の段階は、技術要件の調整です。 それはさまざまな方法で起こります:顧客は私たちに移動計画を立てるように頼むことがあります。 あるヨーロッパの銀行に最適でした:既製の文書が付属していましたが、たとえば、1回の反復でより少ないラックを輸送する方がよいという事実に関連する修正とコメントを行いました(「蟻塚」なしですべてを受信サイトにマウントする必要があるため) 10人のエンジニアのうち)。 経験から、インストールで6人が正常であり、10人がすでに互いに干渉し始めていることがわかります。



最初の段階の結果は、移動の反復中の両方のDPCの前、後、および「間に合わせ」の図、どの機器とその配送方法の正確な理解、各段階の正確な切り替え、シリアル番号、誰、いつ、どのように進むかによるハードウェアのリストです。 3つのサーバーを1つに結合する例を次に示します。



宛先:



オフィスの7階にあるメインサーバールーム





オフィス7階の通信室





オフィス3階のサーバールーム



後(既にこの図を見ました):





ダウンタイムがある場合(可能な場合もあります)、合意されているため、週末に転送が計画されます。 しかし、ちなみに、1月の休日は仕事の面で私たちにとって非常に忙しいことはめったにありません。



2.技術トレーニング



その後、技術的に準備を始めます。 3番目の動きまでに、作業の主要部分は通常失敗せずに行われますが、細かなことに最大限の注意を払う必要があることを理解しています。 たとえば、目的のフォームファクターを備えた忘れられたドライバーは、最短で15分であり、これは非常に望ましくありません。 スコッチテープ、マーカー、ドライバーなどの機器の巨大なチェックリストがあります。



その後、倉庫で最も重要な鉄片用のスペアパーツを用意しました。 はい、私たちはここに非常に大きなサービスデポがあるので、ほとんどすべてのシステムが類似物を見つけることができると言わなければなりません。 輸送後にハードドライブ、電源、またはマザーボードに障害が発生した場合(これらのコンポーネントが最も頻繁に飛行します)、倉庫からすぐに別のコンポーネントがまったく同じ状態になります。 これは、保証対象外の機器を運ぶ顧客にとって特に重要です。



この段階の結果-私たちの側からのすべては、移動の実装の準備ができています。



3.サイトで作業する



最初の反復は、顧客の元のサイトに移動する前の夜に開始されます。 エチケットプリンターの助けを借りて、各ケーブルと各サーバーにマークを付けて、「他」側の目的の切り替えにすぐに正しく適合するようにします。 さらに、マーキングは「現状のまま」ではなく、新しい切り替えの計画に従って行われるため、受信エンジニアは必要に応じてすぐに組み立てることができます。 これは重要です。なぜなら、現在のサイトの1つのラックから、新しいサイトの5つのラックに沿って機器が簡単にクロールできるからです。 最も重要なラベルは、新しいサイトのラック番号と新しいサイトのユニットです。これにより、機器を廊下に置いておくのではなく、開梱直後に配置できます。TIERIIIデータセンターでは、技術的な廊下で15分を超える機器のダウンタイムが許可されないことがよくあります。 警備員もフェンスの外にある機器を見たがらないことがあります。 したがって、それは単に箱から出て、レールが挿入され、すぐに取り付けられます。



マーキングを前もって十分に行うことはできません。最終日に、前の反復とソフトウェアパーツに関係する人々の作業のために、何が起こって何がそうでないかを置き換える可能性があります。 移動の2〜3時間前に、これを行うのは非常に良いことです。 夕方に印を付け、朝にそれを分解し、発動機がそれを取りました。





これは、ワイヤーをマークするために使用する優れたプリンターです。 側面(グレーのボタン)を押すことでトリミングされた粘着テープ、内側にはナイフがあります。 時々変更する必要があります。 プリンターはプログラム可能で、ラベルはシリーズ全体で印刷されました。 各ケーブルには2つの側面から番号が付けられています(それぞれのポートの名前)。



すべてが最初に健康的な帯電防止剤に詰められ、次ににきびのあるフィルムの巨大な山に詰められ、次に段ボールに詰められます。 はい、私達は私達と多くの旅行をした実績のある物流会社と協力しています。 彼らは仕様をよく知っています:異なるラックに適した数のベルト、体に最も平らなサーバーの分布。 彼らはあなたがサーバーにサーバーを置くことができないことを知っています。 彼らは、輸送中にサーバー(ああ、ホラー!)を裏返すことができないことを知っています。 なぜ-彼らは知らないが、どのようなクーデターを手放すのか-彼らはよく理解している。



機器にはほとんどの場合保険がかけられています(非常に古く、廃炉の準備ができているものを除く)。 クーデター、事故、洪水、引っ越し業者の手に対する保険にも。 私(pah-pah)はまだ深刻な保険事件を経験していませんが、もちろん、古いHDDが道路に耐えることができませんでした。



4.次の反復



所定の場所-新しいスキームへの切り替え(ほとんどの場合に行います)、サーバーのパフォーマンスの開始と確認は、顧客と彼のエンジニアに残ります。それらは私たちの助けを借りて実行されることもあります。 お客様が現在の反復で輸送された機器のすべてのサービスを解除した場合にのみ、サイトを離れます。



次に、移動の次の反復が実行されます。 現在のものが最後だった場合-すべてがチェックされ、移動が終了します。



特徴



準備中の最も長いプロセスの1つは、新しいネットワークインフラストラクチャです。 原則として、移動中にサービスは停止しません。これは、2つのActive-Activeインスタンスを作成し、新しい場所で1つを切断、転送、接続するためです。 つまり、輸送時および設置時は、バックアップがない限り、システムはホットリザーブなしで残ります。 5つのサーバーだけを転送する必要がある場合もありますが、3つの段階で転送します。これらは互いに予約しているため、フォールトトレランスを失うことはありません。



多くの場合、移動の繰り返し中でもネットワークトポロジを維持する必要があります。これにより、たとえば、ヘッドデータセンターをノックする地域のすべてを再構築しないようにします。 または、すぐに新しいスキームを開発し、すぐにそれを含める必要があります-ただし、エンドユーザーにとっては何も変わりません。



たとえば、2011年には、2つの大手銀行が合併プロセスを経て、ベース、処理、および調整システムを結合する必要がありました。 1つの銀行のオフィスとデータセンターを2番目の銀行の領域に移動する必要がありました。 これはモスクワ内で行われました。 プロジェクトは6つのステージで構成されていました。 物理的に多くの機器、システムをシャットダウンするためのスケジュールに同意する必要がありました。 銀行はシステムを新しいサイトで運用し、より多くのサーバーを輸送し、顧客はそれらを以前のサーバーと組み合わせてから、新しいバッチを配信しました。 準備状況に応じて、週に1〜2回ドラッグします。 機能のうち、新しいスイッチングシステムがあり、銀行システム管理者は完全に魔法のようなことをしました。彼らは私たちの回路を取り、必要な長さの正確なパッチコードを提供しました。 パッチコードはそれぞれ前のコードよりも20〜30 cm大きかったので、3ターンのワイヤが鼻のように垂れ下がっていませんでした。 同じ設置で、ベンダーの従業員が重鉄の非突然変異を監視するために私たちのところに来ました。



難しい動きがあります。 たとえば、私はかつてデータセンターを運転し、データセンターはオフィスからTIER IIIコロケーションへの再配置を決定しました。 オフィスは動いており、新しいオフィスは機器用に設計されていませんでした。 一般に、彼らは3つのサーバーしか存在しないように古いオフィスに車で行き、部屋に置いただけでした。 その後、一時的な小屋のように、ほぼ10年間、小さな部屋が機器に大きく追加されました。まだラック、床のエアコン、ブレードがありました。キャビネットの1つがエレベーターにまったく収まりませんでした。



ケースは異なっていました。 VDIを導入したときに中央オフィスで地域を統合したため、彼らは全国から鉄を集めました。 ハードウェアとサポートが安価であることに加えて、管理が便利です。 一片の鉄のために、専門家を配置する必要はありません。



彼らはウラジオストクから飛行機で運転し、揺れながらパレットに乗る必要がありました。 このような状況では、工場での梱包が必要になることがよくあります。発泡スチロールとスクリードがあるため、「ネイティブ」なものを見つけようとします。 フィルムと波形だけでは不十分です。飛行機に強い衝撃が加わる可能性があります。 通常、顧客は自分でパッケージを保存し、さらに倉庫に箱入りのものがあります。これまでに届いたすべてのパッケージのサンプルが2〜3個あります。 顧客が大規模なRISCサーバーからボックスを投げた場合、間違いなく同じものがいくつかあるため、非常に便利です。



顧客がハードドライブを引き出してサーバーから個別に取り出すことを要求した場合。 最初にディスクを入手し、挿入順に番号を付けてから、各ディスクを個別に梱包しました。 段ボールに8個セットで積み上げます。 この移動中に、5つのラックの半分の詰め物から5つのディスクが落下しました。 着陸と着陸は誰もが経験したわけではありません。ドライブがネイティブスロットに移動するよりもストレスが大きい場合があります。 その後、彼らは到達を停止し、残りの5回の繰り返しで、2つのディスクのみが死亡しました。 通常、シャーマニズムがあります。サーバーのアップタイムが2年かかり、誰かがオンとオフを切り替えただけで、おっと-HDDが機能しません。



彼らが巨大な金属製の出入口を解体すると、データセンターへのドアは大きさでした。 下限しきい値を削除するためにリーマ、ツイスト。 テープライブラリはパスしませんでした。 彼らがそこに彼女をドラッグしたとき、ドアはそこにありませんでした。 悪魔に囲まれた!



最初の段階でも、すべての人のパスについてだます必要があります。 たとえば、最近、非常に魅力的なケースがありました:責任が増したオブジェクトの1つで外国の発動者が許可されませんでした。 取引相手は午前中に人を変えなければなりませんでした。



大規模な移転では、エンジニアのグループが交代で働いています。 たとえば、多くのラックが一度に移動しました。 金曜日の午後9時にバックアップノードが停止し、土曜日の午後9時にバックアップノードを開始して、メインノードと同期し、それらを先頭ノードに変更する必要があります。 12時間連続して作業するのは難しいので、マウントを解除する人もマウントする人もいます。 マネージャは残り、最初から最後まですべてを監視します。



価格



エンジニアの労働時間の割合は、市場平均よりもわずかに高くなっています(桁違いではありません)。 しかし、この価格は通常、経験のある顧客にとっては完全に満足しています。なぜなら、彼は何を支払うのか知っているからです。 輸送自体のコスト(輸送が生み出す金額-直接放送)は定めていません。 さらに、その場合の交換のためのインフラストラクチャがあります。 所要時間は非常に明確かつ合理的に示されています。2時間-分解、3時間-組立、移動、シンプル。 費用は準備の最初の段階で発表され、緊急事態が発生した場合でも変更されません。 ディスクが飛び出した場合、実際にはさらに時間がかかりますが、余分な時間はかかりません。



顧客自身が時間を6〜12時間増やす場合があります。「予期せぬ状況が発生した場合に翌日と1人の専門家を産みましょう。打ち上げ後に再接続するなど、何かが必要になる場合があります。」



競技では困難です-切り替えスキームを正確に理解するまで作業のタイミングを言うのは難しいため、プラグを配置する必要があります。



そのようなもの。 突然コメントではない質問がある場合-IShklyaev@croc.ruに書いてください。 同じメールで、移動を事前に計算できます(無料)。そのため、何か責任を負う場合のガイドラインがあります。



All Articles