発生しなかった火災の半分:新しいデータセンターへの移行方法

画像 2つの交差点は1つの火災に相当します。

(フォークの知恵)



序文の代わりに



有名な心臓外科医が車のサービスに到着し、修理のために車を引き渡します。 ワークショップで働いているメカニックが、この機会を利用して医師に電話し、彼に質問をしました。



-ドクター! 実際、私たちは同じことをしています。車の「ハート」を取り出し、バルブを抜き、新しいものを入れます。 そして、エンジン全体を交換できます。 いずれにせよ、私の仕事の後、車は新しい「心」で生き続けています。 しかし、あなたはシャベルでお金をrowぎ、私は私の仕事のためにペニーを受け取ります。 なぜそうなのか!



医師が合理的に発言したもの:



-そして、あなたは、作動中のエンジンの大規模なオーバーホールを試みてください!



画像 私たちは急速に成長しており、機器に対応するために常に新しい能力が必要です。 同時に、いかなる場合でもボリュームの増加は、サービスの質の低下をもたらすべきではありません。 これは戦略的な課題です。



夏は休日の時期であり、ほとんどのウェブマスターにとって最も「静かな」期間です。サーバーの異常にスケジュールされた「リブート」がより穏やかに知覚されます。



夏を待ち、新しいデータセンターに移動しました!



挑戦する



ここで何が話せるのでしょうか? 確かに、一見、移動するのにトリッキーなものはありません:特定の精度で、特にサーバーやネットワーク機器である鉄の箱を輸送する場合は、何でもどこでも簡単に輸送できます。 実際、ホスティングを新しい技術サイトに移動するタスク、およびサンクトペテルブルク(これは重要なポイントです!)でも、スパイシーな機能があります-特に、移動中もホスティングプロセスが機能し続けることが非常に望ましいです。 したがって、移動のプロセスで解決すべき主な問題は、サービスの提供におけるダウンタイムを最小限に抑えることでした 。 この目標に基づいて、資金が選ばれました。



再配置計画は、次のデータに基づいて実行されました。





解決策



私たちの前の課題をさまざまな方法で解決することが可能であり、それぞれを慎重に分析しました。 ソリューションの3つの主要なグループが特定されました。



シンプル、安く、不器用



最も簡単なソリューションは次のようになります。





長所:





短所:





このような移転シナリオの利点の量的な優位性は、マイナスの重要性を上回ることはできず、オプションを受け入れませんでした。



時間のかかる、高価な、エレガントな



エレガントなソリューションは、まったく新しい技術プラットフォームを新しい場所に展開することです。つまり、古いデータセンターで利用可能な量の新しい機器、新しいIPアドレスネットワークです。 新しいサイトの準備が整うと、次のことが可能になります。





長所:





短所:





マイナスの数は利点を大幅に上回っており、この解決策も不適切と見なされました。問題を解決するためのツールとして制御されていないプロセスを使用する機会は誰にもありません。



人生



サービス提供の中断期間を決定する要因を分析して、私たちは心から誇りに思うソリューションを開発しました。



技術的要因



画像

組織的要因





機器の新しいデータセンターへの物理的な転送が完了すると、古いデータセンターのネットワークを「支払い」、ネットワークのルーティングを変更するだけで問題なく完了しました。 サイトの作業の中断から、気付かないことがありました。 それにもかかわらず、技術的な理由で彼に気づいた人にとって、サイトの可視性は10分以内に「消えた」。



行われ、実行された決定のマイナスのうち、著しい労力といくつかのオーバーヘッドコストのみに注意する必要があります(たとえば、新しい技術サイト用の「バッファ」機器の購入)。 しかし、これらの瞬間はプロセスの質的な側面に影響を与えなかったため、受け入れられることが判明しました。



組織の結論



もちろん、「稼働中のエンジンのオーバーホール」に成功しませんでした-客観的な理由から、操作を中断せずに機器の物理的な位置を変更することは不可能です。 しかし、「半分火事」の発生を防ぐことができたことを嬉しく思います-共有ホスティングのユーザーによる機器の物理的な移動と、ほとんどのVDSまたは専用レンタルサービスの顧客は、ハードウェアまたはシステムソフトウェアの更新などの通常のフルタイムサーバーの再起動と完全に見分けがつかないように見えました:ニュースレターでお客様に警告した計画された2時間のダウンタイムの代わりに、サイトの平均利用不能時間は1時間20分でした。



All Articles