Huawei HyperMetro-テストおよび実装

HabréのHuawei Oceanstorの第3世代ストレージシステムの主な機能はすでに説明されていますが、プラットフォーム間で「拡張」されるアクセス機能に関する情報はあまりありません。 この省略を閉じようとします。 この資料は、銀行環境におけるお客様の1人による実装結果に基づいて作成されました。



詳細説明



HyperMetroの主な目的は、データセンターの障害に対する保護であり、ストレージ、ディスクシェルフなどのみです。 この機能は、2015年12月にV300R003C00SPC100ファームウェアで使用可能になりました。



実際、これにより、論理ボリュームへの1回限りの読み取りおよび書き込みアクセスが可能になります。論理ボリュームには、異なるテクノロジーサイトにあるストレージシステム上に2つの独立したコピーがあります。 HyperMetroソリューショントポロジを以下に示します。



図1. HyperMetroトポロジー







障害が発生した場合の調停には、Quorumが使用されます。Quorumは3番目のサイトにインストールされ、イーサネット経由で両方のアレイにアクセスでき、Linux(SUSE / RHEL / Ubuntu)のアプリケーションです。 分散ボリュームの読み取りと書き込みは、トランザクションログ(データ変更ログ-DCL)への書き込みによってアレイ間でロックを交換することにより、異なるサイトから1つのブロックへの書き込みの可能性を防ぐため、どのサイトから2つのストレージシステムへでも可能です。 また、両方のストレージシステムのキャッシュへの書き込みは、順次ではなく並行して実行されることに注意してください。 HyperMetroでの記録プロセスは次のとおりです。



図2.分散ボリュームに書き込むときの操作の順序







MPIO Huawei Ultrapathドライバー(Oceanstor V3に付属)は、ローカルの読み取り/書き込みを優先して、クロスサイトトラフィックを回避します。 サイト間のパフォーマンスバランシングが許可されます。 FCだけでなく、iSCSIもホストへのアクセスと複製の両方に使用できます。



HyperMetro関係を作成した後、両方のボリュームは対称的で同等と見なされます。 ただし、ストレージシステム間でクォーラム障害と通信が発生した場合、スプリットブレインの状況を回避するために、HyperMetroの関係ごとに優先順位が設定されます。 整合性グループを使用して、ボリュームの複数のペアを組み合わせることができます。 コピーの1つに障害が発生した場合、ほとんどの場合、データへのアクセスの損失はありません。



3番目のサイトがない場合、HyperMetroは静的優先モードで使用できます。 このモードは、障害が発生した場合に優先順位の高いストレージシステム(優先サイト)を優先して自動意思決定を提供します。 メインストレージシステムに障害が発生した場合は、各ボリュームペアまたは整合性グループのHyperMetro関係の優先度を変更して、非優先アレイを手動で起動する必要があります。 アレイは、クォーラムまたはすべてのアクセスパスが失敗すると、クォーラムフリーモードになります。 いずれかのサイトにクォーラムを配置した場合、クォーラムが落ちた場合、別のサイトのデータへのアクセスは提供されません。手動で切り替える必要があります。



長所:





短所:





競争力のあるソリューション



サイト間で分散されるボリュームは従来の同期複製に技術的に基づいているという事実により、ほとんどの大手メーカーはすでに同様のソリューションを持っています:HPE 3Par Peer Persistance、IBM HyperSwap、HDS Global Active Device、Fujitsu Storage Cluster、Dell Compellent Live Volume。 また、上記よりもはるかに早期に登場し、IBM SVCストレッチクラスター、EMC VPLEX Metro、およびNetapp MetroClusterなどの独自のソリューションに基づいた、サイト間のデータ保護ソリューションを強調することができます。



この資料では、異なるメーカーの製品を比較するという目標を追求しませんでした。 ただし、コメントでは、意思決定アーキテクチャの特定のポイントの比較に関する質問に答えようとします。



実装



HyperMetroは新しい未検証の機能であったため、デモファンドの機器に基づいて顧客と最初にテストすることにしました。 テストでは、DWDMで接続された2つの顧客サーバーサイトを使用しました。 2つのBrocade工場に基づく統合されたSANネットワーク。 各サイト-SAS 10k rpmディスクとSSDを備えた1つのストレージシステムHuawei OceanStor 5500 V3、VMwareを備えたx86ブレードサーバーファーム。



2つのストレージシステム、LUNで、整合性グループが順番に作成され、HyperMetro関係が構成されます。 その後、ボリュームは両方のストレージシステムから必要なホストにアドレス指定されます。 サーバーは、IOmeterを実行するテスト仮想マシンを実行しました。 いずれかのストレージシステムの障害をシミュレートする場合、パフォーマンスの大幅な低下(> 10%)は観察されませんでした。 50%未満のCPUコントローラーをロードする場合。



完全な構成の後、アレイのハードシャットダウン(コントローラーから電源ケーブルを抜く)を行ってもアクセスが失われることはありませんでした。 アレイ間の接続が復元された後、ボリュームは手動で同期されます(各HyperMetro関係の設定で自動モードを構成できます-回復ポリシー)。 必要に応じて、同期プロセスを一時停止、展開、または再起動して、ボリュームを完全に再同期できます。 グラフィカルメニューまたはコマンドインターフェイスを使用してアレイを手動で再ロードした場合、別のストレージシステムを介したアクセス切り替えは発生しないことに注意してください。



その過程で、さまざまな障害のシミュレーションを作成しました(下の表を参照)。 システムの動作は、この表およびメーカーのドキュメントに記載されている動作と完全に一致しています。

機器の性能 リンクヘルス 結果
SHD№1 SHD№2 定足数 No. 1 <-> Q 2番<-> Q 1番<-> 2番
1。 + + + + + + すべてがいつものように動作します
2。 - + + + + + それへのアクセスは作業用ストレージを経由します
3。 + - + + + +
4。 -* + + - + -
5。 + -* + * + - -
6。 + + - - - + それへのアクセスは両方のSHDを経由します。 20秒間です。 クォーラムレス優先モードに切り替えます
7。 + + - + + +
8.1。 + -* - + + + それへのアクセスは、ストレージの優先順位を通過します。 優先度がクラッシュした場合、非優先度ストレージでアクセスを手動で有効にします
8.2。 + -* - + + + それへのアクセスは停止され、ストレージへのアクセスを手動で含める必要があります
9。 + + + - + + それへのアクセスは両方のSHDを経由します。
+ + + + - +
11。 + + + + + - 仲裁が発生します。 それへのアクセスは、ストレージの優先順位を通過します。
12。 + + + - + - それへのアクセスは、SHD No. 2を経由します。
13。 - + + + - + アクセスは一時停止されています。 ストレージ№2からのアクセスを手動で有効にする必要があります


* 4定足数のないストレージを使用したサイトの崩壊

* 5クォーラムを使用したスト​​レージからのサイトのフォール

* 8.1手順7の20秒以上後にストレージ障害が発生した

* 8.2手順7の後、20秒未満でストレージ障害が発生しました



テストに成功した後、顧客はターゲット構成を承認しました。 このようなテスト後のソリューションの実装は迅速で問題がありませんでした。 システムは、5か月間時計のように機能しています。 24 * 7モードのテクニカルサポートは、当社のサービスセンターによって提供されます(ジェットは、最高レベルのHuaweiサービスパートナーである認定サービスパートナー5つ星です)。 偽りの慎みがなければ、顧客はHyperMetroの機能とOceanStorベースのソリューションのパフォーマンスに完全に満足していることに注意してください。 彼は、保護されたデータの量をさらに増やす予定です。



この資料は、Jet Infosystems社のストレージシステムのシニアデザインエンジニアであるDmitry Kostryukovによって作成されました。



All Articles