データセンターでの適切なバックアップ



CROC DatacenterのEMC Avamar



複数のサーバーからなるこの巨大なキャビネットは、EMC Avamarと呼ばれます。 彼は私たちのデータセンターに立って、バックアップに携わっており、非常に興味深いものにしています。



キャビネットの中身は何ですか?



技術的には、これはx86サーバーのブロックであり、現在10個あります。 アーキテクチャは次のとおりです。スペアノードとコントロールノードがあり、残りの8にデータが書き込まれます。 冗長性(ハミングコードの原理、RAINの均一な分布-独立ノードの冗長配列)が与えられた場合、いずれかのノードに障害が発生すると、データが保存されます。 この時点でスペアユニットは殺されたユニットを置き換えます。 合計で、各ノードの50%のみがシステムで直接使用されます。バックアップノード、パリティノード、および後半はデータの安全性を確保する必要性になります。 200 TBアレイの物理容量は62.5 TBになります。



各ノードには、SUSE Linux OSと専用の専用ソフトウェア(複合体のサーバー部分)があります。 ノードは、外部バックアップトラフィックを内部サービストラフィックから分離する内部スイッチによって相互接続されます。



単一ノードの構造は12台のディスクで、そのうちの6台には基本データが含まれ、もう6台にはそれらをミラーリング(RAID1)し、OS用のssdディスクがあります。







バックアップ元はどこですか?



EMC Avamarの主な目的は、さまざまなソースからの戦闘システムの「ホット」バックアップです。
  1. 「クラウド」(データセンター内の「クラウド」、「クラウド」仮想ネットワーク内、ただしそれらからバックアップできます)から。
  2. 他のラックの物理サーバー。
  3. 顧客のインフラストラクチャの仮想マシンと物理サーバーから、ケーブルをデータセンターまで、またはインターネット経由で延長します。








Avamarの利点は何ですか?



キャビネットの特別な機能は次のとおりです。



1.重複排除。 データは小さなブロックに保存され、複製データはブロックへのリンクとして保存されます。 本質的に同じドキュメントの異なるバージョンである、または単一のテンプレートに基づいて作成された50の異なるテキストドキュメントをロードすると、重複排除プロセスの過程で、可変長の多数のブロックにblocks打されます。 さらに、各ドキュメントの基礎には関連ドキュメントからの多くの情報が含まれているため、これらのブロックのほとんどが繰り返されます。 重複するブロックはすべて、実質的に「無重量」の参照に置き換えられます。 これにより、製造元によれば、バックアップファイルを最大500回まで圧縮できます。 実際に、お客様では、重複排除によるファイル圧縮の15〜20倍の指標を観察しています。



2.この特定のハードウェアおよびソフトウェア複合体の最もクールなものの1つは、 ソースの重複排除です 。 つまり、サーバーからバックアップを作成する場合、実際に転送する必要のあるピースの決定は、Avamarにすでにある「到着した」データを分析した後ではなく、ホスト自体でその場で直接実行されます。 つまり、最初のバックアップはデータベースの100%(たとえば、2 TB)であり、実際には2番目、3番目、およびそれ以降-約0.1%-つまり、それぞれ約200 MB(実際には増分コピー)です。 リモートオフィス、巨大な拠点、またはそのようなもののバックアップを1分で行うのは、おとぎ話にすぎません。



3. 異なるソフトウェアとの互換性 。 具体的には-メインOSおよびアプリケーションソフトウェアを使用します。 なぜ必要なのですか? 毎分数千のトランザクションが行われる戦闘データベースを想像してください。 「額」のコピーを開始すると、コピーを開始してからコピーを終了するまで、データベースが変更され、無関係でエラーのある削除されたデータがバックアップに入ります。 100万件のトランザクションには1時間かかる場合があり、手作業でも復元できないデータから非常に大きな混乱が生じます。 したがって、ベースキャストを作成し(バックアップのために「フリーズ」)、このキャストのコピーを開始するSoftinaエージェントが必要です。 さらに、エージェントはデータを圧縮し、送信中に暗号化します。 私たちが持っている魔法のワードローブには、すぐにあらゆる種類のエージェントが付属しています。



一般的なソリューションスキーム:





互換性とは何ですか?



システムソフトウェア: アプリケーションソフトウェア:

これはどのように使用できますか?









私たちのサイトのソリューション全体のコストに戻る-はい、それは本当に高いです。 しかし、このコストは多くの顧客に分割され、この「共同」体制により、個々の顧客のコストは削減されます。 データは互いに完全に分離されています。バックアップのみが表示されます。





顧客インターフェースのスクリーンショット



誰がどのように応募していますか?



興味深いケースがいくつかあります。 残念ながら、これまでのところ次のように企業名を挙げることはできません。



なぜ信頼性が高く便利なのですか?



  1. リモートストレージ 。 これは、メインインフラストラクチャ(インフラストラクチャがデータセンターに接続されている場合は別のマシンルーム、別のデータセンターにある可能性があります)からはほど遠い、つまり、少なくとも戦闘車両が展開されている場所ではありません)。 これにより、すべての情報が一度に失われるリスクが大幅に削減されます。
  2. データはディスクに保存されます 。 EMC Avamarは、このような場合に使用される従来のテープライブラリではありませんが、ディスクアレイ、つまり情報セキュリティが向上しています。
  3. これは、従量課金サービスとして 、つまりストレージごとにギガバイトごとに販売されます。 月末に、顧客のアカウントのデータ量に応じて荷渡が行われます-支払額が支払われます。 これは「クラウドアプローチ」であり、便利です。設備投資は運用費用になります。
  4. テクニカルサポートは外部委託されています。 さらに、これはインテグレーターの通常のサポートです。「FAQ行」ではなく、結果に対する作業上の問題の完全な解決策です。




したがって、信頼性の高いバックアップが必要な場合は、EMC AvamarとCookieを使用してください



All Articles