EMC VNX5400のI / Oパフォヌマンスに察するキャッシュレベルの圱響の評䟡

はじめに



キャッシュメカニズムがEMC VNXe3200ストレヌゞシステムのゞュニアモデル゚ントリレベルのパフォヌマンスに䞎える圱響に぀いおの蚘事をテストし、曞いた埌、手は定期的にかゆみを起こし、叀いVNX2アレむでも同じこずをしたした。 最近、そのような機䌚が珟れたした。 VNX5400でテストを実行できたした。 VNX5400を盎接テストするこずに加えお、EMC ExtremCache゜リュヌションeMLCチップ䞊のPCI-E SSDカヌドEMC XtremSF700 +゜フトりェアEMC XtremSWをテストするこずが刀明したした。 ただし、EMC ExtremCacheに぀いおは、次の蚘事がありたす。 それたでの間、VNX2アレむに぀いおお話したしょう。



EMC 2は、2013幎秋にミッドレンゞレベルのストレヌゞシステムの補品ラむンを曎新したした。 私の意芋では、第2䞖代のVNXアレむVNX2は、第1䞖代のVNXVNX1で行われたミスに関するよくできた䜜業のように芋えたした。 ベンダヌは、ミッドレンゞラむンの基本的か぀革新的なアップデヌトずしおそれらを発衚したした。 ただし、垂堎に登堎しおから1幎以䞊たった今でも、VNX2の関連性は倱われおいたせん。 アレむ自䜓の特性や機胜に぀いおは説明したせん。公匏ドキュメントのData SheetずSpec Sheetぞのリンクのみを提䟛したす。



スタンドずテストの説明



ネタバレの䞋
テストはIOMETERを䜿甚しお実行されたした。 負荷プロファむルは、 VNXe3200のテスト時ず同じです 。 暙準デヌタベヌスパタヌンIntel / StorageReview.com。







1 CPU4コアず4GB RAMを搭茉したHP DL360 G5サヌバヌがありたした。 サヌバヌには2぀のPCI-Eスロットがありたす。 VNX5400に盎接接続されたデュアルポヌトHBA Qlogic 4Gb / sは、スロットの1぀にむンストヌルされたした。 CPUの物理コアはVNXe3200のテスト時よりもはるかに小さいため、最初に各ワヌカヌIOMETERの入力/出力フロヌの数を増やす必芁がありたした。 1 CPUコアに察する1ワヌカヌの比率。 各ワヌカヌに察しお、3぀のI / Oストリヌムが最初に2の「乗数」で蚭定されたした。぀たり、 サむクル内のテストの埌続の実行15分ごずに、フロヌの数が2倍に増加したした。 3/6/12/24/48 IOフロヌのワヌカヌでの連続した実行は5回のみです。 䞀般に、テストファむルは12/24/48/96/192ストリヌムを受信したした。 ぀たり 最倧倀はVNXe3200ず同じです。 各テストの時間は15x5 = 75分であり、「ランプアップ時間」はカりントしたせん。 IOMETERの蚭定は次のずおりです。







VNX5400には、OSがむンストヌルされた衛星を備えたディスクFastVPプヌルが既にあったため、すべおを発明しお再䜜成するこずはしたせんでした。 プヌルには、3぀の100Gb SSDディスクExtreme Perfomance TierずRaid5 4 + 1Perfomance Tierの15個の900Gb SAS 10K RPMディスクが含たれおいたした。 3぀のプラむベヌトナヌザヌには衚瀺されたせん4 + 1構成のRAIDグルヌプ。 最䜎利甚可胜ティアポリシヌを備えたテストムヌンはプヌルで䜜成されたため、これらのムヌンはSASディスク䞊に完党に配眮でき、Extreme PerfomanceティアのSSDディスクは結果に圱響したせん。











サヌバヌは、OS Win2012R2 SP1ず゜フトりェアを䜿甚しお、EMC 2からPowerPathムヌンパスを管理したした。



いく぀かの蚈算。



EMC 2は、パフォヌマンスの蚈算時にSAS 10k RPMディスクの150 IOPSの倀を掚奚しおいたすFC / SAS 15k RPM-180 IOPS、SATA / NL_SAS-90 IOPS、SSD eMLS-3500 IOPS、SSD SLC-5000 IOPS。 ぀たり、理論䞊は可胜な限り、15個のディスクで150x15 = 2250 IOPSを実珟できたす。 67/33の割合での読み取り/曞き蟌み負荷プロファむルずRAID5ぞの曞き蟌みのオヌバヌヘッドを考慮しお、これらのサヌバヌディスクから取埗するIOPSの数を蚈算する必芁がありたす。 1぀の未知の2250 = X * 0.33 * 4 + X * 0.67で次の方皋匏が埗られたす。 Xはディスクからサヌバヌを受け取るIOPSであり、4はRaid5のレコヌドの「ペナルティ」のサむズです。 その結果、X = 2250 / 1.99 =〜1130 IOPSになりたす。 実際、ピヌク負荷では、通垞、IOPSの倀は1.5〜2倍になりたす。 ぀たり、3぀のプラむベヌトRaid5ディスクグルヌプすべおにデヌタが正しく分散されおいるため、1695-2260 IOPSの範囲を期埅できたす。


テストず結果



1.キャッシュコントロヌラヌの動䜜テストSP-ストレヌゞプロセッサヌVNX5400 file 2Gb



このテストは2 GBファむルNTFSのテストLUNのサむズは10 Gbで実斜されたため、SPキャッシュに完党に収たり、その結果、すべおの入力/出力はストレヌゞコントロヌラヌのRAMから凊理されたす。 ぀たり、条件付きで、小さな「ホット」デヌタ領域がアレむに珟れたした。 同時に、アレむのFastCacheがオフになりたした。

その結果、アレむに組み蟌たれたUnisphere Analyzerで次のグラフを取埗したした。







同時に、SPキャッシュは次のように埋められたしたキャッシュは読み取りず曞き蟌みの䞡方で機胜したす。







぀たり、テストの開始埌数分以内に、テストファむルのすべおの2GbがCacheにアップロヌドされたした。



IOMETERの結果による平均IOPSの入力/出力ストリヌム数ぞの䟝存性のグラフ







IOMETERの結果によるI / Oストリヌムの数に察するI / O応答時間の平均倀の䟝存関係のグラフ







䞀般に、デヌタベヌスの平均応答時間は10ミリ秒たでが快適であるず受け入れられおいるこずを思い出しおください。 グラフによるず、192のIOストリヌムがあり、これはかなり倧きな倀であるため、VNXe3200での同様のテストよりも平均応答時間がわずかに短くなりたした8ミリ秒でした。 絶察的な意味では、違いは重芁ではありたせんが、それでもIOPSの数に倧きなギャップがある理由の1぀です。 VNXe3200は、同様のテストで192のIOスレッドで平均玄23800 IOPSでした。 応答時間ずIOPSの割合の差を蚈算するず、あちこちで玄20〜25が埗られたす。



2.キャッシュコントロヌラヌの動䜜テストSP-ストレヌゞプロセッサヌVNX5400 file 15Gb



テストは15GBファむルNTFSを䜿甚したLUN-20Gbで実行されたした。 FastCacheはただオフです。 VNX5400のSPのRAMのサむズは16 Gbです。 ただし、アレむのログに䟝存しおいる堎合、キャッシングに䜿甚される実際のRAMはVNX5400で玄4Gbです。 他のすべおは明らかに、最も基本的なOSコントロヌラヌおよびその他の非垞に幅広いストレヌゞ機胜階局化、シンプロビゞョニング、スナップショット、クロヌン、レプリケヌション、高速キャッシュなどの動䜜を保蚌するために䜿甚されたす。







したがっお、15 Gbの高負荷ホットデヌタはSPキャッシュに収たりたせん。 䞀般的に、これはたさにUnisphere Analizerのチャヌトに衚瀺されるものです。 すべおの15 Gbの完党にランダムな入力/出力は、コントロヌラヌによっお完党にキャッシュするこずはできたせん。そのため、このテストでは物理スピンドルがパフォヌマンスの倧郚分を提䟛したす。 盎接駆動したす。







同時に、SP Cacheは効率的ではありたせんが、匕き続き機胜したす。







IOMETERの結果による平均IOPSの入力/出力ストリヌム数ぞの䟝存性のグラフ







IOMETERの結果によるI / Oストリヌムの数に察するI / O応答時間の平均倀の䟝存関係のグラフ







グラフによるず、すでに24ストリヌムでの応答時間は玄14ミリ秒です。 快適ゟヌンを超えたした。 たた、ディスクのピヌクパフォヌマンスの芋積もりがあたりにも芋萜ずしおいたこずに驚き、それを敎理するために「行きたした」。 その結果、テスト䞭にパフォヌマンス局のすべおのプラむベヌトRGの負荷が同じではないこずがわかりたした。 ぀たり パフォヌマンス䞊の理由から、テストファむルはパフォヌマンス局の3぀のRGすべおに均等に分散されおいたせん。 グラフでは、このように芋えたすドラむブ5、6、および7はExtreme Perfomance TierのSSDです。







぀たり、15個すべおのスピンドルが「フル」テストに関䞎しおいるわけではありたせん。 VNX2アレむ䞊のFastVPプヌルでの同様の効果をスムヌズにするために、異なる容量SSD、SAS、NL_SASのディスク間だけでなく、同じティア内のプラむベヌトRG間でも「ホット」および「コヌルド」デヌタを再配垃できるテクノロゞヌがありたす。 プラむベヌトRG間でのデヌタの再配垃は、階局間のデヌタの移行ず同様に、スケゞュヌルず同時に行われたす。 アレむむンタヌフェむスでは、これは[階局化]タブのプヌルプロパティで確認できたす。 特に、私の堎合、テスト盎埌は次のように芋えたした。







アレむがアむドル状態のずき、りィンドりは次のようになりたした。







もう1぀の興味深い画像は、SPキャッシュを充填するグラフずテスト枈みLUNの党䜓的なパフォヌマンスを重ね合わせるこずで確認できたす。







グラフは、かなり䞍快な状況であっおも、SP Cacheにより「远加の」IOPSを獲埗できるこずを瀺しおいたす。



3. VNX5400ファむル15GbでFastCacheをテストする



アレむでFastCacheを有効にした埌Raid1の2぀の100Gb SSD、15GbNTFSのLUN-20Gbの同じファむルでテストを実行したした。 EMC 2アレむのFastCacheは、SP Cacheずアレむディスク自䜓の間に組み蟌たれおいるSSDディスクに基づく远加レベルのキャッシュです。 15Gbたたは条件付きで「ホット」なデヌタ領域のファむルは100Gb FastCacheに完党に収たる必芁がありたす。これにより、前のテストの結果が改善されたす。

Unisphere Analizerから次のグラフを取埗したしたIOPSで。







FastCacheは次のように入力されたす。







Read Hits / s-FastCacheから解決された読み取り操䜜。

Read Misses / s-FastCacheでデヌタが芋぀からず、アレむディスクから芁求された操䜜。







曞き蟌みヒット/秒-ディスクぞの「叀い」デヌタの予備ダンプを必芁ずしないFastCacheでの曞き蟌み操䜜キャッシュ堎所の予備クリア、たたはキャッシュに曞き蟌たれたがただディスクに転送されおいないデヌタを芁求した操䜜。

曞き蟌みミス/ s-FastCacheで解決されなかった曞き蟌み操䜜、たたはキャッシュスペヌスの匷制緊急解攟が必芁な曞き蟌み操䜜。







たた、SP Cacheはアむドル状態にならず、入出力の䞀郚を解決したした。







サヌバヌ偎では、IOMTRは次のように芋えたした。

IOMETERの結果による平均IOPSの入力/出力ストリヌム数ぞの䟝存性のグラフ







IOMETERの結果によるI / Oストリヌムの数に察するI / O応答時間の平均倀の䟝存関係のグラフ







最新のグラフは、FastCacheの「ホット」゚リアをロヌドした埌、応答時間がさらに枛少し、入力/出力フロヌが増加するに぀れおのみ増加し始めるこずを瀺しおいたす。 同時に、グラフは、100のIOストリヌムの倀をはるかに超えお10ミリ秒の䞊限を「突砎」したす。



4. VNX5400ファむル150GbでFastCacheをテストする



次のテストは150Gbファむルで実行されたしたNTFS 200GbでのテストLUN。 ぀たり このテストの「ホット」デヌタ領域は、アレむのFastCacheサむズを玄1.5倍超えたした。 以䞋の結果が埗られたした。

Unisphere AnalizerのグラフIOPS。







FastCacheにデヌタを入力しおいたしたが、かなりゆっくりでした。 75分のテストが終了するたでに、玄20がいっぱいになりたした150Gbのテストファむルのうち玄20Gb。







FastCacheでの読み取り操䜜のヒットではなく、ヒットのチャヌト。







FastCacheでの曞き蟌み操䜜のチャヌトのヒット/秒およびミス/秒。







SPキャッシュもアむドル状態ではありたせんでした。







サヌバヌ偎ずIOMETRから芋た様子。

IOMETERの結果による平均IOPSの入力/出力ストリヌム数ぞの䟝存性のグラフ







IOMETERの結果によるI / Oストリヌムの数に察するI / O応答時間の平均倀の䟝存関係のグラフ







グラフは、IOPS倀がFastCacheなしで15Gbファむルをテストしたずきよりもわずかに高いこずを瀺しおいたす。 したがっお、この䞍快な状況では、FastCacheが構成から远加のIOPSを圧瞮するのに圹立぀ず結論付けるこずができたす。 しかし実際には、すべおがそうではないこずが刀明したした。



たず、このテストでは、「パフォヌマンス局」のすべおのプラむベヌトRAIDグルヌプRaid5 4 + 1がより均等にロヌドされたした。







次に、150Gbファむルで远加のテストを行うこずにしたしたが、FastCacheはオフになりたした。 IOMETRのグラフは次のずおりです最初は信じおいなかったため、テストを2回実斜したした。



IOMETERの結果による平均IOPSの入力/出力ストリヌム数ぞの䟝存性のグラフ







IOMETERの結果によるI / Oストリヌムの数に察するI / O応答時間の平均倀の䟝存関係のグラフ







぀たり、ホットデヌタの量がFastCacheのサむズを超え、ランダムリク゚ストの割合が高い状況では、FastCacheの入力に時間がかかりたす。 このような状況では、FastCacheは、わずかではありたすが、応答時間に远加の遅延をもたらしたす。 この状況では、プヌル内のSSDディスクで远加のExtreme Performance Tierを䜿甚するこずを提案できたす。 この堎合、ホットデヌタの䞀郚はその䞊に「萜ち着き」、FastCacheを介しお凊理されたせん。 したがっお、FastCacheを介しお凊理されるホットデヌタの量は枛少し、より快適な範囲になりたす。 根拠がないように、別のテストを実斜したした。



5. VNX5400ファむル80GbでFastCacheをテストする



このテストは、サむズが80GbNTFS 100GbのテストLUNのファむルで実行されたした。これは、テスト察象のアレむのFastCacheボリュヌムに十分近いサむズです。 ぀たり、「ホット」デヌタ領域は非垞に倧きかったが、それでもFastCacheに完党に適合した。

Unisphere AnalizerのグラフIOPS。







FastCacheは、150Gbファむルよりもアクティブにいっぱいになりたした。







SP Cacheは、入力/出力の䞀郚も解決したした。







サヌバヌ偎ずIOMETRから芋るず、すべおが150Gbファむルよりもずっずバラ色に芋えたした。

IOMETERの結果による平均IOPSの入力/出力ストリヌム数ぞの䟝存性のグラフ







IOMETERの結果によるI / Oストリヌムの数に察するI / O応答時間の平均倀の䟝存関係のグラフ







箄24のIOストリヌムからテストの開始から玄15分、デヌタがたすたすFastCacheに取り蟌たれ始めたした。 したがっお、テストの党䜓的なパフォヌマンスも向䞊し始めたしたが、IOストリヌムの増加に䌎う応答時間は、150Gbファむルを䜿甚したテストほど増加したせんでした。



ディスクプヌルに関する小さな䜙談



ネタバレの䞋
ディスクプヌルを蚭蚈する際に、ホットデヌタ領域ずりォヌムデヌタ領域の実際のサむズがわからない堎合、EMCは、3レベルプヌルに぀いお次の比率を維持するこずを掚奚したす。

10-SSDドラむブ

20-SASドラむブ

70-NL-SASホむヌル

たた、フラッシュ局を自動的にプヌルに远加するず、プヌルで䜜成された薄い衛星のすべおのメタデヌタがSSDに配眮されるこずに泚意しおください。 それらに十分なスペヌスがある堎合。 これにより、薄い月ずプヌルの党䜓的なパフォヌマンスを䞊げるこずができたす。 このメタデヌタでは、プヌル䞊の现い衛星が実際に占有しおいる各1Tbの3Gbボリュヌムに基づいお、SSDに远加のスペヌスを蚈画する必芁がありたす。 このすべおにより、「最高の利甚可胜なティア」のタむルポリシヌを持぀衛星は、他のデヌタよりもSSDダッシュに眮かれたずきに優先されたす。



シン、重耇排陀、たたは圧瞮されたムヌンに察しお「利甚可胜な最も䜎いティア」ポリシヌを䜿甚するず、最も遅いディスクにメタデヌタが配眮されたす。 これらはこれらの衛星の性胜に悪圱響を及がしたす。



ティアリングが正垞に機胜するには、プヌルの空き容量が必芁です。 各ダッシュの少なくずも10の空き容量が掚奚されたす。 そうしないず、システムはプヌル内の異なるタむプのディスク間でデヌタの断片チャンクを「転送」できなくなりたす。




結論



テストに基づいお、次のこずが蚀えたす。 奇劙に聞こえるかもしれたせんが、FastCacheは垞に良いずは限りたせん。 䞍適切に蚭蚈されたシステムでは、劣化の方向を含むパフォヌマンスに圱響を䞎える可胜性がありたす。 蚭蚈段階で芋逃さないように、デモアレむで実際の負荷のコピヌたたは䞀郚を駆動するこずをお勧めしたす。 ベンダヌからデモ配列をリク゚ストできたす。 これが䞍可胜な堎合は、同じベンダヌが蚈算で䜿甚するこずを提案しおいるホット/りォヌム/コヌルドデヌタ比率から続行する必芁がありたす統蚈デヌタおよびその他の考慮事項に基づく。 私の意芋では、デモアレむを䜿甚した最初のオプションの方が適しおいたす。 䞀般に、適切に蚭蚈されたアレむでは、VNX2の远加レベルのキャッシュFastCacheにより、パフォヌマンスがかなり向䞊したす。



VNX5400のパフォヌマンスは、少なくずも小芏暡で同等の構成ディスクの数、FastCacheサむズでVNXe3200のパフォヌマンスを倧きく超えるこずはありたせん。 これはおそらく、若いアレむが今幎2014幎にのみリリヌスされたずいう事実によるものです。 同じ結論がVNX5200にも適甚できたす。VNX5200では、SPコントロヌラヌはVNX5400ず倉わりたせん亀換のサヌビス郚品番号は同じです。 VNX5200には、ディスクの最倧数の制限125個察250個。VNX5400の堎合、FastCacheの最倧サむズVNX5400の堎合は600Gb察1000Gbの制限のみがあり、サヌバヌを接続するためのポヌトを持぀远加の拡匵カヌド甚のスロットが1぀少なくなっおいたす。



実行されるすべおのテストは、実際のワヌクロヌドずは関係のない「合成」です。 ただし、私の意芋では、このようなモデリングは、特定の状況におけるストレヌゞシステムの動䜜の䞀般的な傟向を理解するのに圹立ちたす。



PSのように



ストリヌミングロヌド甚のストレヌゞが必芁な堎合Nr倧きなビデオストリヌムの蚘録ず凊理、ここではキャッシュは圹に立ちたせん。 オヌバヌフロヌが発生し、デヌタストレヌゞシステムのスピンドルディスクの数がこの状況で決定するずきが来るでしょう。

トランザクションの負荷が非垞に高い堎合。 数千たたは数䞇のナヌザヌ向けの倧芏暡なOLTPデヌタベヌスたたはVDIの堎合、おそらく埓来のストレヌゞず階局化ではなく、オヌルフラッシュアレむが必芁になりたす。



All Articles