また、DellEMCは、新世代はVNX2の少なくとも3倍の生産性があると主張しています。
このすべてが何から来たのか疑問に思うなら...
スタンドとテストの説明
ネタバレの下
最初に、1つのCPU(4コア)と4GB RAMを搭載した同じ古いHP DL360 G5からテスト用のベンチを組み立てました。 PCI-Eスロットにのみ、2つのシングルポート8Gb / s HBA Emulex LPE1250-EがFC 16Gb / s Unity 400Fポートに直接接続されていました。 少し後で判明したように、このサーバーのCPUパフォーマンスはストレージをロードするのに十分ではありませんでした。 そのため、IOPS生成の追加ソースとして、1 CPU(12コア)および24GB RAMを搭載したBlade HP BL460c G7がアレイに接続されました。 確かに、ブレードバスケットには4Gポートを備えたFCスイッチがあります。 しかし、彼らが言うように、「彼らは贈り物の馬のために歯を見ていない」。 とにかく手元に他の計算機はありませんでした。 サーバーは、EMCのOS Win2012R2 SP1およびPowerPathソフトウェアを使用して、LUNへのアクセスパスを管理しました。
Unity 400Fアレイでは、プールがRAID5(8 + 1)構成で作成されました。 プールは、サーバーに接続された2つのテストLUNをホストしました。 NTFSファイルシステムと400GBのテストファイルがLUN上に作成され、結果に対するコントローラーキャッシュの影響が排除されました。
IOMETERの設定は次のとおりです。
つまり 各サーバーで4人の作業員(合計8人)が働いており、その後のテストの各段階で、入力/出力ストリームの数が2倍になりました。 したがって、各ワーカーに対して、1、2、4、16、32、64、128、256、512スレッドを順番に実行します。 そして全体として、アレイには各段階で4、8、16、32、64、128、256、512、1024、2048、4096のストリームがありました。
Unity 400Fアレイでは、プールがRAID5(8 + 1)構成で作成されました。 プールは、サーバーに接続された2つのテストLUNをホストしました。 NTFSファイルシステムと400GBのテストファイルがLUN上に作成され、結果に対するコントローラーキャッシュの影響が排除されました。
IOMETERの設定は次のとおりです。
つまり 各サーバーで4人の作業員(合計8人)が働いており、その後のテストの各段階で、入力/出力ストリームの数が2倍になりました。 したがって、各ワーカーに対して、1、2、4、16、32、64、128、256、512スレッドを順番に実行します。 そして全体として、アレイには各段階で4、8、16、32、64、128、256、512、1024、2048、4096のストリームがありました。
伝統により、いくつかの計算
パフォーマンスを計算する場合、DellEMCはSSDドライブに最大値20,000 IOPSを使用することを推奨しています(こちらのドキュメントを参照 )。
つまり、理論上可能な限り、9個のディスクで20,000 * 9 = 180,000 IOPSを出力できます。 負荷プロファイルを考慮して、これらのサーバーディスクから取得するIOPSの数を計算する必要があります。 ここで、読み取り/書き込みの割合は、67%/ 33%です。 また、RAID5への書き込みのオーバーヘッドも考慮する必要があります。 1つの未知数で次の式が得られます:180,000 = X * 0.33 * 4 + X * 0.67。 Xはディスクからサーバーを受け取るIOPSであり、 4はRAID5の書き込みペナルティサイズです。 その結果、平均X = 180,000 / 1.99 = 〜90452 IOPSになります。
テストと結果
テストの結果、I / Oフローの数に次のIOPS依存性がありました。
グラフは、テストされたLUNの512 I / Oフローで飽和が発生し、同時に約142,000 IOPSの値に到達したことを明確に示しています。 VNX5400のテストを見ると、コントローラーキャッシュをテストしても、IOPSの最大値が32000 IOPSのしきい値を超えていないことがわかります。 また、VNX5400 I / O飽和は約48スレッドで発生しました。 上記の構成では、1台のHP DL360 G5サーバーが最大約72,000 IOPSを発行したことにも注意してください。 その後、100%のCPU負荷で休みました。 なぜ実際に2番目の「コンピューター」を探す必要があったのか。
Unityには、アレイのさまざまなコンポーネントのパフォーマンス統計を収集する優れた機能があります。 そのため、たとえば、アレイディスクごとにIOPSの負荷グラフを表示できます(それぞれ個別にまたは一度に)。
グラフから、最大でディスクが、ベンダーがパフォーマンスの計算時に採用することを推奨している値よりも「多少」多くなることがわかります。
テストされたUnity構成の応答時間は次のように増加しました。
つまり 「飽和点」であっても、IOPSの成長が停止するストリーム数が増加すると(512ストリーム)、応答時間は5ミリ秒を超えませんでした。
応答時間とIOPSの数。
繰り返しますが、VNX5400でコントローラーキャッシュをテストするときの応答時間と比較すると、VNX5400では、約31,000 IOPSおよび約30 I / Oストリームで1msの応答時間に既に達していることがわかります(これは実際にはRAM上にあります)。 Unity、SSDでは、これは〜64000 IOPSでのみ発生します。 UnityにSSDドライブをさらに追加すると、グラフ上の値が1ミリ秒のこの交点は、IOPSスケールでさらに移動します。
入力/出力ストリームの数に対する帯域幅の依存:
アレイは、サイズが8KBのパケットのストリームを1GB / s(ギガバイト/秒)を超える速度で受信および提供したことがわかりました。
はい、読者に迷惑をかけないでください。Unity400Fアレイのさまざまなコンポーネントの一連のパフォーマンスグラフが好奇心のために隠されています...
セカンドスポイラーの下
IOMETR-aソースファイルへのリンク。
結論
結論は、誰もが自分のためになると思います。
私に関しては、興味深い新しいストレージシステムが市場に登場しました。これは、少数のSSDドライブでも高性能を示しています。 そして、現在利用可能なSSDサイズを考慮すると(そして、DellEMC for Unityはすでに7.68 TB SSDを利用でき、近い将来15.36TB SSDのサポートが期待されます)、今後数年でSSDと「スピンドル」ドライブが混在するハイブリッドアレイになると思います物語になります。
PSファンが「いくらの費用がかかりますか?」 ベンダーはプレゼンテーションで、Unity F(オールフラッシュ)の価格は18,000ドルから、ハイブリッド構成の価格は1万ドル未満であることを示しています。 しかし、プレゼンテーションはすべて「ブルジョア」であるため、ロシアの現実の価格は異なる場合があります。 いずれの場合でも、特定の状況ごとにローカルベンダーまたはそのパートナーに確認することをお勧めします。