無防備なデータ

大規模なITビジネスコンシューマーの頭では、ビジネスアプリケーションからこれらのアプリケーションによって処理されるデータへの重点が最終的​​に移行しました。 また、「データセンター」というフレーズでは、3番目の単語が2番目の単語ではなく、ふさわしく区別されています。 ビジネスにおけるデータの主な役割を理解するとともに、それらを失うことへのパニックな恐怖がありました。 実際、IDCの統計によると、運用データへのアクセスが長期にわたって不足している場合、ほとんどの企業は破産を予想しています。



データストレージの信頼性を確保するには、根本的に異なる2つのアプローチがあります。 最初はバックアップです。 RPO(目標復旧時間)とRTO(目標復旧時間)の2つの主要な概念が冗長性に関連しています。 RPOは、バックアップに対応するデータがシステムに含まれていた時点です。 RTOは、バックアップ/復元プロセスにかかる時間です。 当然、企業データの増加に伴い、RTOはデータ量に比例して増加し、RPOはますます少なくなります。 これは、最新の最も価値のあるデータが最も脆弱になり、そのボリュームが増加することを意味します。



2番目のアプローチは「データは常にそこにあります」、つまり、データが到着した時点でストレージシステムに直接データを保護します。 そして、それはリアルタイムRPOとゼロタイRTOを意味します。 このアプローチは、ストレージシステム(特にEMC)の大御所によって着実に推進されています。 提案された概念に従って保護を提供する最も一般的な方法はRAIDです(独立ディスクの冗長アレイ。ところで、「独立」という言葉の代わりに「安価」と表示され、最近のファイバーチャネルディスクにはほとんど適用されません)。 動作の原則は、複数のディスクをグループにまとめ、その中にデータと冗長情報を保存することです。 RAIDレベルについて話すことはほとんど意味がないと思います。なぜなら、現在最も人気のあるレベル5に興味があるからです。

((カット))

RAID5グループでは、データはすべてのディスクに「拡散」して保存され、修正コード(データの回復に必要な情報)も「拡散」されます。 RAID5の冗長性は、有用なデータのボリュームの最適な25%です。 RAID5は、グループが一度に1つのドライブの障害に耐えられるように構築されています。



このようなストレージテクノロジーを使用すると、データは常に常に存在しているように見えます。 「常に」がどの程度かを見てみましょう。 ここでの微妙な点は、グループが一度に1つのドライブのみの障害に耐えることができるということです。 このディスクを即座に交換した場合でも、グループはこのディスクにデータと修正コードを復元(再構築)するのに時間がかかります。 もちろん、データは同時に利用できますが、再構築手順中に別のディスクに障害が発生すると、グループは破棄されます。 グループ内のディスクが多くなり、各ディスクのボリュームが大きくなるほど、それらの1つが頻繁に失敗し、再構築に時間がかかります。 多数の安価なボリュームディスクのRAID5グループが1年に数回(3〜4回)完全に崩壊する可能性がある程度まで!



この問題の解決策は、二重修正、RAID6またはRAID5 DPの導入です。 このようなグループは、ある時点で2つのディスクの障害に耐えることができます(上で説明したように、大規模なグループの「瞬間」は再構築手順の非常に長い時間です)。 連続して2枚のディスクが故障することは、頻繁なイベントではありません。 理論的には、20 TB未満のグループの場合、RAID6レベルはRAID5よりも平均的なパラメーターのディスクに対して2桁優れたデータ保護(データ損失までの時間)を提供します。



練習をすると、確率の理論に疑問が生じます。再構築時に2番目のディスクが故障する可能性が非常に高いです。 これは、特に深刻なワークロードのシステムに当てはまります。 これには2つの要因が影響します。 第一に、本稼働システムでの再構築手順はディスクに深刻な負荷をかけ、すでに負荷の高いシステムでは読み取り/書き込み操作の数が大幅に増加します。 第二に、現代のマイクロエレクトロニクスのレベルでは、ディスクは互いにクローンとして似た組立ラインから出てきます。 したがって、MTBFのような重要なパラメーターはほぼ同じです。 したがって、最大稼働時間に達したディスクの1つは、グループ全体の負荷の増加につながり、通常の状態よりも速く、残りのディスクのリソースが枯渇し、その結果、別のディスクに障害が発生する可能性が高くなります。 一種の停電。



ストレージメーカーは、できる限りこれに苦労しています。 たとえば、ストレージシステムを注文する場合、IBMは、MTBFディスクに異質性を導入し、グループ内の2つのディスクが同時に故障する可能性を減らすために、さまざまなメーカーおよび異なるロットのディスクを提供します。 ただし、データの概念は常に存在し、保存されません。 また、データ保護とともに、インプレースバックアップが引き続き使用されます。 ちなみに、ハードウェア障害からデータを完全に保護することもできません...



これを覚えておいてください:あなたのビジネスはあなたのデータと同様に脆弱です。 絶対的なデータ保護は不可能ですが、データ保護、信頼性の高いデバイス、ストレージシステムの完全バックアップへの組み合わせアプローチを使用すると、企業データを失う可能性を最小限に抑えることができます。



All Articles