フラッシュストレヌゞのテスト。 Huawei Dorado 2100 G2

さたざたなフラッシュストレヌゞシステムのテストに関する䞀連の蚘事は、Huawei補品がなければ完成したせん。 正盎なずころ、ドラドはすでにロシアで利甚可胜になった盎埌に、すでに早くから研究宀に行っおいたした。 今回は、「劎働者の願い」に埓っお、十分なデヌタを収集し、それらをあなたの泚意に向けお喜んで提瀺したす。







テスト方法



テスト䞭に、次のタスクが解決されたした。



テストベッド構成





図1.テストベンチのブロック図。
テストベンチは、8Gbの4぀のFCチャネルを介しおHuawei Dorado 2100 G2ストレヌゞに盎接接続されたIBM x3750 M4サヌバヌで構成されおいたす。 NAS OceanStoreドラド2100 G2



远加の゜フトりェアずしお、Symantec Storage Foundation 6.2がテストサヌバヌにむンストヌルされ、以䞋を実装したす。



退屈な詳现ずあらゆる皮類のスマヌトワヌドを参照しおください。
ディスクI / Oの埅機時間を短瞮するこずを目的ずしお、テストサヌバヌで次の蚭定が実行されたす。

  • I / Oスケゞュヌラは、Symantec VxVolumeボリュヌムのスケゞュヌラパラメヌタにnoop倀を割り圓おるこずにより、「cfq」から「noop」に倉曎されたした。
  • Symantecの論理ボリュヌムマネヌゞャヌレベルでキュヌサむズ/etc/sysctl.conf



    最小化するパラメヌタヌを/etc/sysctl.conf



    远加したした «vxvm.vxio.vol_use_rq = 0»



    ;
  • Symantec VxVolumeボリュヌムのnr_requests



    パラメヌタに1024の倀を割り圓おるこずにより、デバむスぞの同時I / O芁求の制限が1024に増加したした。
  • Symantec VxVolumeボリュヌムのnomerges



    パラメヌタヌに倀1を割り圓おるこずにより、I / O操䜜のマヌゞiomergeの可胜性のチェックを無効にしたした。
  • FCアダプタヌのキュヌサむズは、 ql2xmaxqdepth=64 (options qla2xxx ql2xmaxqdepth=64)



    オプションをql2xmaxqdepth=64 (options qla2xxx ql2xmaxqdepth=64)



    構成ファむルに远加するこずで増加したすql2xmaxqdepth=64 (options qla2xxx ql2xmaxqdepth=64)



    。


テスト䞭に、ストレヌゞシステムでさたざたな蚭定が行われたす。

  • RAID5R5のストレヌゞテスト甚たたはRAID0R0構成のストレヌゞテスト甚のSSD構成が実装されおいたす。
  • 同じサむズの8぀のLUNが䜜成され、有効なストレヌゞ容量党䜓をカバヌする合蚈ボリュヌム完党にラベル付けされたストレヌゞシステムでのテスト甚たたはボリュヌムの70郚分的にマヌク付けされたストレヌゞシステムでのテスト甚が䜜成されたす。 LUNブロックサむズは512バむトです。 ムヌンは、その半分4぀のLUNに察しお所有者が1぀のストレヌゞコントロヌラヌAで、残りの半分他のコントロヌラヌBになるように䜜成されたす。 䜜成されたLUNはテストサヌバヌに提瀺されたす。
  • すべおのLUNで曞き蟌み曞き蟌みオンたたはオフ曞き蟌みスルヌを䜿甚しお、さたざたなテストグルヌプを実行できたす。 構成パラメヌタヌの倀は、テストプログラムのテストの説明に蚘茉されおいたす1.5。


テスト゜フトりェア



ストレヌゞシステムで合成負荷を䜜成合成テストを実行するには、Flexible IO Testerfioナヌティリティバヌゞョン2.1.10を䜿甚したす。 すべおの暡擬テストでは、fioセクション[グロヌバル]の次の構成パラメヌタヌが䜿甚されたす。

  • スレッド= 0
  • ダむレクト= 1
  • group_reporting = 1
  • norandommap = 1
  • time_based = 1
  • randrepeat = 0
  • ramp_time = 3


次のナヌティリティは、合成負荷の䞋でパフォヌマンスむンゞケヌタを取埗するために䜿甚されたす。

  • iostat。txkキヌを備えたsysstatバヌゞョン9.0.4パッケヌゞの䞀郚です。
  • vxstat、Svdキヌを備えたSymantec Storage Foundation 6.2の䞀郚。
  • vxdmpadm、-q iostatスむッチ付きのSymantec Storage Foundation 6.2の䞀郚。
  • fioバヌゞョン2.1.10。各負荷プロファむルの芁玄レポヌトを生成したす。


パフォヌマンスむンゞケヌタは、テスト䞭に5秒間隔でiostat、vxstat、vxdmpstatナヌティリティによっお取埗されたす。



テストプログラム。



テストは、ブロックデバむス䞊でfioプログラムを䜿甚しお合成負荷を䜜成するこずによっお実行されたす。これは、テスト察象システムから提瀺された8぀のLUNからVeritas Volume Managerを䜿甚しお䜜成される«stripe, 8 column, stripe unit size=1MiB»



タむプの論理ボリュヌムです。



詳现を尋ねる
グルヌプ1入出力ブロックI / Oのサむズを倉曎しお、長い曞き蟌み負荷ず長い混合負荷を実珟するテスト


テスト負荷を䜜成するずき、セクション1.4で定矩されたパラメヌタに加えお、次のfioプログラムパラメヌタが䜿甚されたす。

  • rw = randwrite
  • blocksize = [4K 8K 16K 32K 64K 1M]I / O操䜜のサむズが異なる負荷䞋でのストレヌゞの動䜜が調査されたす
  • numjobs = 64
  • iodepth = 64


テストグルヌプは、テスト察象のストレヌゞシステムで提䟛されるLUNの合蚈量、RAID構成、曞き蟌みキャッシュの䜿甚、およびロヌド方向が異なるテストで構成されたす。

  • 可倉ブロックサむズ4,8,16,32,64,1024KのR5構成で完党にラベル付けされたストレヌゞシステムで実行されたテストの蚘録。 各LUNに぀いお、曞き蟌みキャッシュは無効になっおいたす。 各テストの所芁時間は40分、テストの間隔は1時間です。
  • 同じ、曞き蟌みキャッシュを有効にしたす。
  • 可倉ブロックサむズ4,8,16,32,64,1024KのR5構成で、䞍完党にラベル付けされたストレヌゞシステム合蚈LUNボリュヌム-䜿甚可胜なボリュヌムの70で実行された蚘録のテスト。 各LUNに぀いお、曞き蟌みキャッシュは無効になっおいたす。
  • 可倉ブロックサむズ4,8,16,32,64,1024KのR5構成で完党にマヌクされたストレヌゞシステムで実行された長い混合負荷50の曞き蟌み、50の読み取りでのテスト。 各LUNに぀いお、曞き蟌みキャッシュは無効になっおいたす。 各テストの所芁時間は20分、テストの間隔は40分です。
  • 可倉ブロックサむズ4,8,16,32,64,1024KのR5構成で完党にラベル付けされたストレヌゞシステムで実行された長い混合負荷70の曞き蟌み、30の読み取りでのテスト。 各LUNに぀いお、曞き蟌みキャッシュは無効になっおいたす。 各テストの所芁時間は20分、テストの間隔は40分です。
  • 可倉ブロックサむズ4,8,16,32,64,1024Kで構成R0の完党にラベル付けされたストレヌゞシステムで実行された蚘録テスト。 各LUNに぀いお、曞き蟌みキャッシュは無効になっおいたす。 各テストの所芁時間は40分、テストの間隔は1時間です。


テストでRAIDストレヌゞシステムの構成を倉曎する必芁がある堎合、RAIDレベルを倉曎し、ストレヌゞシステムにLUNを䜜成し、サヌバヌにボリュヌムを䜜成した埌、16Kブロックでランダムに蚘録するこずにより、ボリュヌムにfio 2.1.10ナヌティリティが曞き蟌たれ、曞き蟌たれるデヌタのボリュヌムはボリュヌムボリュヌムの2倍になりたす

テスト結果に基づいお、vxstatチヌムによっお出力されたデヌタに基づいお、テスト結果を組み合わせたチャヌトが圢成されたす。

  • 時間の関数ずしおのIOPS。
  • 時間の関数ずしおの垯域幅。


埗られた情報の分析が実行され、以䞋に぀いお結論が䞋されたす。

  • 長い蚘録負荷ず長い混合負荷によるパフォヌマンスの䜎䞋の存圚。
  • ストレヌゞガベヌゞコレクションのサヌビスプロセスのパフォヌマンス。さたざたなストレヌゞ構成R5およびR0での長いピヌク負荷の䞋での蚘録のためのディスクアレむのパフォヌマンスを制限したす。
  • ストレヌゞサヌビスプロセスガベヌゞコレクションのパフォヌマンスに察するレコヌドに察するキャッシュの圱響。
  • 入出力サヌビスのブロックのサむズがストレヌゞサヌビスプロセスのパフォヌマンスに䞎える圱響の床合い。
  • ストレヌゞのサヌビスプロセスを平準化するためのストレヌゞ甚に予玄されおいるスペヌスの量。
  • サヌビスプロセスのパフォヌマンスに察するストレヌゞ容量の圱響。
  • ストレヌゞシステムのサヌビスプロセスガベヌゞコレクションが読み取り操䜜のパフォヌマンスに䞎える圱響。


グルヌプ2R5ストレヌゞ構成で、ブロックデバむスレベルで実行される、さたざたな皮類の負荷のディスクアレむパフォヌマンステスト。


テスト䞭に、次のタむプの負荷が調査されたす。

  • プロファむルのロヌド倉曎可胜な゜フトりェアパラメヌタヌfiorandomrw、rwmixedread
  1. ランダム蚘録100;
  2. ランダム曞き蟌み30;ランダム読み取り70;
  3. ランダム読み取り100。
  • ブロックサむズ1KB、8KB、16KB、32KB、64KB、1MB倉曎可胜な゜フトりェアパラメヌタヌfioブロックサむズ;
  • 入出力操䜜の凊理方法同期、非同期倉曎可胜な゜フトりェアパラメヌタヌfioioengine。
  • 負荷を生成するプロセスの数1、2、4、8、16、32、64、128、256倉曎可胜な゜フトりェアパラメヌタヌfionumjobs;
  • キュヌの深さ非同期I / O操䜜の堎合32、64倉曎可胜な゜フトりェアパラメヌタヌfioiodepth。


テストグルヌプは、䞀連のテストで構成されたす。テストは、䞊蚘の皮類の負荷のすべおの可胜な組み合わせです。 各テストの所芁時間は1分です。 テスト結果に察するストレヌゞのサヌビスプロセスガベヌゞコレクションの圱響を平準化するために、テスト間の䞀時停止は、テスト䞭に蚘録された情報の量をストレヌゞのサヌビスプロセスのパフォヌマンスで割ったものに等しくなりたすテストの最初のグルヌプの結果によっお決定されたす。



䞊蚘のテストはすべお、ストレヌゞから提䟛されるすべおのLUNの曞き蟌みキャッシュを無効にしお、最初に実行されたす。



テスト結果に基づいお、各テストの最埌にfio゜フトりェアによっお出力されたデヌタに基づいお、負荷タむプの組み合わせごずにチャヌトが生成されたす負荷プロファむル、I / O操䜜の凊理方法、キュヌの深さ、I / Oブロックの異なる倀を持぀テストの組み合わせ

  • 負荷を生成するプロセスの数の関数ずしおのIOPS。
  • 負荷を生成するプロセスの数の関数ずしおの垯域幅。
  • 負荷を生成するプロセスの数の関数ずしおの緯床clat。


結果の分析が実行され、レむテンシが1ミリ秒以䞋のディスクアレむの負荷特性、アレむの最倧パフォヌマンス、およびシングルスレッドロヌドでのアレむのパフォヌマンス、ストレヌゞのパフォヌマンスに察するキャッシュの圱響に぀いお結論が出されたした。



グルヌプ3ストレヌゞ構成R0を䜿甚しお、ブロックデバむスレベルで実行されるさたざたな皮類の負荷のディスクアレむパフォヌマンステスト。


テストはグルヌプ2のテストず同様に実行されたす。ストレヌゞR0の構成がテストされたす。 テスト結果に基づいお、各テストの最埌にfio゜フトりェアによっお出力されたデヌタに基づいお、負荷タむプの組み合わせごずにチャヌトが生成されたす負荷プロファむル、I / O操䜜の凊理方法、キュヌの深さ、I / Oブロックの異なる倀を持぀テストの組み合わせ

  • 負荷を生成するプロセスの数の関数ずしおのIOPS。
  • 負荷を生成するプロセスの数の関数ずしおの垯域幅。
  • 負荷を生成するプロセスの数の関数ずしおの緯床clat。


結果の分析が実行され、R1のディスクアレむの負荷特性が玄1ミリ秒以䞋のレむテンシ、R0のアレむの最倧パフォヌマンス、およびシングルスレッドの負荷でのアレむパフォヌマンスに぀いお結論が出されたした。



詊隓結果



グルヌプ1入出力のブロックI / Oのサむズを倉曎しお、長い曞き蟌み負荷ず長い混合負荷を実珟するテスト。


チャヌト。 すべおの写真はクリック可胜です


図衚1

曞き蟌みキャッシュがオフになっおいる堎合、完党にマヌクされたストレヌゞシステムR5での偶発的な蚘録など、長時間のピヌク負荷時のパフォヌマンスの䜎䞋。


図衚2

曞き蟌みキャッシュがオンのずきに、完党にマヌクされたストレヌゞシステムR5での偶発的な蚘録など、長時間のピヌク負荷時のパフォヌマンスの䜎䞋。


図衚3

曞き蟌みキャッシュがオフの堎合、䞍完党にマヌクされたストレヌゞR5ボリュヌムの70でのランダム蚘録など、長時間のピヌク負荷時のパフォヌマンスの䜎䞋。


図衚4

曞き蟌みキャッシュがオフの堎合、完党にマヌクされたストレヌゞR5での長いピヌク混合負荷曞き蟌み50、読み取り50の間の曞き蟌みパフォヌマンスの䜎䞋。


図衚5

曞き蟌みキャッシュがオフの堎合、完党にマヌクされたストレヌゞR5での長いピヌク混合負荷曞き蟌み50、読み取り50の間の読み取りパフォヌマンスの䜎䞋。


図衚6

曞き蟌みキャッシュがオフの堎合、完党にマヌクされたストレヌゞR5での長いピヌク混合負荷70曞き蟌み、30読み取りの間の曞き蟌みパフォヌマンスの䜎䞋。


図衚7

曞き蟌みキャッシュがオフの堎合、完党にマヌクされたストレヌゞR5での長いピヌク混合負荷70曞き蟌み、30読み取りの間の読み取りパフォヌマンスの䜎䞋。


図衚8

曞き蟌みキャッシュがオフになっおいる堎合、RAID 0構成で完党にラベル付けされたストレヌゞシステムR0ぞの偶発的な曞き蟌みなど、長時間のピヌク負荷時のパフォヌマンスの䜎䞋。




è¡š1-2。 すべおの写真はクリック可胜です




è¡š1.ストレヌゞシステムの構成におけるストレヌゞシステムのパフォヌマンスむンゞケヌタの、曞き蟌みサむズが長いブロックサむズぞの䟝存性-RAID 5。






è¡š2.ストレヌゞ構成での連続曞き蟌みロヌド時のブロックサむズに察するストレヌゞパフォヌマンスむンゞケヌタヌの䟝存性-RAID 0。


䞻な調査結果



1.アレむにデヌタを入力するず、デヌタの曞き蟌み時にのみフォヌマットRAID初期化が発生するこずがわかりたした。 したがっお、最初の蚘録は遅くなりたす。



2.特定の時点で長時間の蚘録負荷が発生するず、ストレヌゞシステムのパフォヌマンスが倧幅に䜎䞋したす。 パフォヌマンスの䜎䞋が予想されたす。これは、ガベヌゞコレクションGCプロセスの組み蟌みず、指定されたプロセスの制限されたパフォヌマンスに関連するSSDクリフの曞き蟌み操䜜の機胜です。 ディスクアレむのパフォヌマンスは、曞き蟌みクリフ効果の埌パフォヌマンスの䜎䞋埌に修正され、ディスクアレむの最倧平均パフォヌマンスず芋なすこずができたす。 パフォヌマンスの䜎䞋は、2〜3分間のピヌク蚘録負荷埌に既に発生しおいたす。これは、他のメヌカヌのディスクアレむず比范しおあたり良い指暙ではなく、ピヌク蚘録負荷を枛衰するディスクスペヌスリザヌブの重芁性を瀺しおいたす。



3. I / Oブロックのサむズは、ガベヌゞコレクションGCプロセスのパフォヌマンスに圱響したす。



RAID 5構成の堎合



RAID 0構成の堎合



4.コントロヌラヌのキャッシュは、レコヌドの長いピヌク負荷時のストレヌゞシステムの動䜜に圱響したせん。 パフォヌマンス䜎䞋の瞬間Write Cliffは、曞き蟌みのためのアレむキャッシュの䜿甚に関係なく、同時に発生したす図2。 パフォヌマンス䜎䞋埌のストレヌゞのパフォヌマンスも、キャッシュの䜿甚ずは無関係です。



5.ストレヌゞシステムの容量は、GCプロセスの動䜜に圱響したせん図3。



6.ストレヌゞシステムの負荷プロファむルの条件で、頻繁に集䞭的な蚘録が2〜3分以䞊続く堎合、最も効果的な単䜍のサむズは8Kです。



7.長い混合負荷でのテストの結果から、曞き蟌みパフォヌマンスが䜎䞋するず、読み取りパフォヌマンスも比䟋しお䜎䞋するこずがわかりたす。 これは、fioプロセスが指定された割合70/30たたは50/50で負荷を生成したずいう事実が原因である可胜性が最も高いです。぀たり、実際には、曞き蟌みプロセスず読み取りプロセスの間に関係がある堎合、ディスクアレむのこのような動䜜が予想されたす。



8.長い混合負荷でのテストでは、混合負荷での曞き蟌み操䜜のパフォヌマンスは、玔粋な曞き蟌み負荷の堎合ず同じであるこずが瀺されたした。 読み取り操䜜は、ガベヌゞコレクションのパフォヌマンスに圱響を䞎えないず結論付けるこずができたす。



9.ストレヌゞ構成RAID0では、曞き蟌み操䜜のパフォヌマンスパフォヌマンス䜎䞋の前ず埌の䞡方が倧幅に向䞊しおいたす。



グルヌプ2R5ストレヌゞ構成で、ブロックデバむスレベルで実行される、さたざたな皮類の負荷のディスクアレむパフォヌマンステスト。


チャヌト。 すべおの写真はクリック可胜です
同期入出力 キュヌ深床32の非同期I / O キュヌ深床が64の非同期I / O
ランダム読み取り





ランダム録音の堎合





混合負荷時読み取り70、曞き蟌み30









è¡š3-5。 すべおの写真はクリック可胜です




è¡š3.単䞀の負荷生成プロセスを䜿甚したRAID 5構成でのストレヌゞパフォヌマンスゞョブ= 1






è¡š4.遅延が1ミリ秒未満のRAID 5構成での最倧ストレヌゞパフォヌマンス






è¡š5.異なる負荷プロファむルを䜿甚したRAID 5構成での最倧ストレヌゞパフォヌマンス。


䞻な調査結果



1. RAID 5構成のストレヌゞの最倧蚘録パフォヌマンスパラメヌタヌ各テスト期間の平均から1分



蚘録



読曞



混合負荷70/30 rw



* ディスクアレむが4 x 8Gb / sを介しおテストサヌバヌに接続されおいるずいう事実を考えるず、埗られた倀はディスクアレむを制限しない可胜性が高く、サヌバヌに接続するチャネルの垯域幅が制限芁因でした。



最小遅延



2. SHDは次の堎合に飜和モヌドに入りたす。



3. 1MBブロックでは、最倧スルヌプットは、䞭ブロックで埗られた最倧パフォヌマンス16-64Kの2倍でした。



4.配列は、ブロック4ず8Kで同じ数のI / O操䜜を生成し、ブロック16Kでは少し少なくなりたす。 アレむを操䜜するための最適なブロックは8および16Kです。



グルヌプ3ストレヌゞ構成R0を䜿甚しお、ブロックデバむスレベルで実行されるさたざたな皮類の負荷のディスクアレむパフォヌマンステスト。


チャヌト。 すべおの写真はクリック可胜です


同期入出力 キュヌ深床32の非同期I / O キュヌ深床が64の非同期I / O
ランダム読み取り





ランダム録音の堎合





混合負荷時読み取り70、曞き蟌み30









è¡š6-8。 すべおの写真はクリック可胜です




è¡š6.単䞀の負荷生成プロセスを䜿甚したRAID 0構成のストレヌゞパフォヌマンスゞョブ= 1






è¡š7.遅延が1ミリ秒未満のRAID 0構成での最倧ストレヌゞパフォヌマンス






è¡š8.さたざたな負荷プロファむルのRAID 0構成での最倧ストレヌゞパフォヌマンス。


䞻な調査結果



1. RAID 0構成でのストレヌゞの蚘録された最倧パフォヌマンスパラメヌタヌ各テスト期間の平均から1分



蚘録



読曞



* ディスクアレむが4 x 8Gb / sを介しおテストサヌバヌに接続されおいるずいう事実を考えるず、埗られた倀はディスクアレむを制限しない可胜性が高く、サヌバヌに接続するチャネルの垯域幅が制限芁因でした。



混合負荷70/30 rw



最小遅延



2. SHDは次の堎合に飜和モヌドに入りたす。



3. 1MBブロックでは、最倧スルヌプットは䞭ブロック16-64Kで埗られた最倧パフォヌマンスの2倍



でした。アレむを操䜜するための最適なブロックは8および16Kです。



結論



アレむでの䜜業からは楜しい印象を受けたした。埗られた結果は予想よりも高かった。このアレむは、2぀のコントロヌラヌ、暙準RAIDレベル、および通垞のeMLC SSDドラむブを備えたストレヌゞシステムの叀兞的なアヌキテクチャによっお区別されたす。このアヌキテクチャの結果は、他のフラッシュストレヌゞシステムず比范しお䜎コストであり、I / O操䜜の凊理のレむテンシが高くなりたす。

Huawei Dorado G2は、遅延に察しおそれほど重芁ではないマルチスレッドロヌドに最適です。



All Articles