DASずIsilonでのHadoopパフォヌマンスの比范





Isilonを䜿甚するず、異なるバヌゞョンのHadoopを備えた耇数のクラスタヌに同時にサヌビスを提䟛できるデヌタレむクを䜜成できるずいう事実に぀いおは既に曞きたした。 その出版物では、倚くの堎合、Isilonで実行されるシステムはDASストレヌゞを䜿甚する埓来のクラスタヌよりも高速であるず述べたした。 これは埌に、察応するクラスタヌでさたざたなHadoopベンチマヌクを実行するこずにより、IDCで確認されたした。 今回は、Isilonクラスタヌのパフォヌマンスが向䞊する理由ず、クラスタヌ内でのデヌタの分散ず分散に応じおIsilonクラスタヌがどのように倉化するかを怜蚎したす。



テスト環境





レポヌトで他の詳现を芋぀けるこずができたす。



NFSアクセス



たず第䞀に、IDCはNFSアクセスで読み曞きをテストしたした。 予想どおり、Isilonは4぀のノヌドでもより良い結果を瀺したした。





サむズが10 GBのファむルをコピヌする期間ブロックの長さは指定されおいたせんが、ほずんどの堎合1 MB以䞊です。



蚘録によるず、Isilonは4.2倍高速でした。 これは、NFSを介しおデヌタを受信するこずが重芁な堎合に特に重芁です。 たた、読み取り速床の面では、生産性は37倍高くなりたす。



Hadoopワヌクロヌド



暙準のHadoopベンチマヌクを䜿甚したテスト䞭に、3皮類のワヌクロヌドが比范されたした。



  1. TeraGenを䜿甚した順次蚘録
  2. TeraSortによる順次曞き蟌み/読み取り
  3. TeraValidateを䜿甚した順次読み取り




TeraGen、TeraSort、TeraValidateの3぀の異なるタむプのロヌドを備えたランタむム。



録音時、Isilonのパフォヌマンスは2.6倍、他の2぀のタむプでは1.5倍でした。 特定の結果を衚に瀺したす。



むシロン Hadoop das
テラゲン 1681 Mb / s 605 Mb / s
TeraSort 642 Mb / s 416 Mb / s
テラバリデヌト 2832 Mb / s 1828 Mb / s


コンピュヌティングノヌドの構成が同じ䞞められたIsilonおよびDASクラスタヌのパフォヌマンス。



デヌタはそれ自䜓を物語っおいたす。 次に、OneFSがDASクラスタヌよりもこのようなパフォヌマンス䞊の利点をどのように達成したかを芋おみたしょう。



Isilon䞊のファむルの読み取り



I / O操䜜はDASクラスタヌ内のすべおのノヌドに分散されたすが、個々の64メガバむトブロックは1぀のノヌドのみによっお凊理されたす。 同時に、Isilonでは、ワヌクロヌドはより小さな郚分でノヌド間で分割されたす。 読み取り操䜜は、次の手順で構成されたす。



  1. 蚈算ノヌドは、すべおのIsilonノヌドSPoFなしで実行されるName NodeサヌビスからHDFSメタデヌタを芁求したす。
  2. サヌビスは、コンピュヌティングノヌドが配眮されおいる同じラック内の3぀のノヌドのそれぞれのIPアドレスずブロック番号を返したす。 これにより、ラックの局所性の効率が向䞊したす。
  3. コンピュヌティングノヌドは、受信したリストの最初のノヌドで実行されるデヌタノヌドサヌビスから64メガバむトのHDFSブロックの読み取りを芁求したす。
  4. 芁求されたノヌドは、内郚Infinibandネットワヌクを介しお、必芁な64メガバむトHDFSブロックを構成する128キロバむトのIsilonブロックをすべお収集したす。 これらのブロックが2次キャッシュにない堎合、ディスクから読み取られたす。 これは、64 MBブロック党䜓が単䞀のノヌドから読み取られるDASクラスタヌずの根本的な違いです。 ぀たり、Isilonクラスタヌでは、DASクラスタヌよりもはるかに倚くのディスクずプロセッサヌによっおI / O操䜜が凊理されたす。
  5. 芁求されたノヌドは、完党なHDFSブロックをコンピュヌティングノヌドに返したす。


Isilonぞのファむルの曞き蟌み



クラむアントがクラスタヌにファむルを曞き蟌みたい堎合、クラむアントが接続されおいるノヌドはファむルの受信ず凊理に埓事したす。



  1. ノヌドは、FEC蚈算を含むファむル蚘録蚈画を䜜成したすボリュヌムの芳点では、デヌタの安党性を確保するために各ブロックの3぀のコピヌが通垞䜜成されるDASクラスタヌに比べおはるかに経枈的です。
  2. このノヌドに割り圓おられたデヌタブロックは、そのNVRAMに蚘録されたす。 NVRAMカヌドの存圚はIsilonの利点の1぀であり、DASクラスタヌでは䜿甚できたせん。
  3. 他のノヌドに割り圓おられたデヌタブロックは、たずInfinibandネットワヌクを介しおこれらのノヌドの2番目のレベルのキャッシュに転送され、そこからNVRAMに転送されたす。
  4. 察応するデヌタおよびFECブロックがすべおのノヌドのNVRAMにロヌドされるずすぐに、クラむアントは蚘録の成功の確認を受け取りたす。 ぀たり、すべおのI / O操䜜がNVRAMにバッファリングされおいる間は、ディスクにデヌタを曞き蟌むこずはできたせん。
  5. デヌタブロックは、読み取り芁求が受信された堎合に備えお、各ノヌドの2次キャッシュに保存されたす。
  6. 次に、デヌタがディスクに曞き蟌たれたす。


Hadoopのパフォヌマンスに察するディスクの局所性の重芁性の神話



ディスクのロヌカリティはHadoopの高いパフォヌマンスにずっお重芁であるず䞻匵する管理者からの異議に遭遇するこずがありたす。 ただし、最初はHadoopがスタヌトポロゞの䜎速ネットワヌクで動䜜するように蚭蚈されおいるこずを芚えおおく必芁がありたす。スタヌトポロゞは、1 Gbit / sの垯域幅が特城です。 このような状況では、特定のサヌバヌ内ですべおのI / O操䜜を実行しようず努力するだけですディスクの局所性。



いく぀かの事実は、ディスクの局所性がHad​​oopのパフォヌマンスに関係しおいないこずを瀺唆しおいたす。



I.高速ネットワヌクが暙準になりたした。





この図は、I / O操䜜のルヌトを瀺しおいたす。 明らかに、ボトルネックはネットワヌクではなくドラむブです10 GBEネットワヌクの堎合。





DASアヌキテクチャでのI / O操䜜のルヌト。 ディスクの数を2倍にしおも、それらは䟝然ずしおボトルネックのたたです。 そのため、ほずんどの堎合、ドラむブの堎所はパフォヌマンスに圱響したせん。



II。 ディスクの局所性は、次の兞型的な状況で倱われたす。





III。 パフォヌマンスを向䞊させるデヌタ耇補





Isilonのパフォヌマンスに圱響するその他の技術



OneFSは非垞に成熟した補品であり、マルチプロトコルアクセスによる高性胜ず䜎遅延の点で10幎以䞊にわたっお改善されおきたした。 これに関する倚くの情報をネット䞊で芋぀けるこずができたす。 キヌポむントのみに蚀及したす。





結論ずしお



Isilonは、Hadoopなどの集䞭的なワヌクロヌド向けに蚭蚈された分散ファむルシステムを備えた氎平スケヌルのNASです。 HDFSは、プロトコルおよびName NodeサヌビスずData Nodeサヌビスずしお実装され、すべおのノヌドでアクセスが提䟛されたす。 IDCによるパフォヌマンステストでは、DASクラスタヌに比べおIsilonクラスタヌの2.5倍の利点が瀺されたした。 ネットワヌクテクノロゞヌの進歩により、ディスクの堎所はIsilonシステムでのHadoopの動䜜に圱響したせん。 Isilonには、パフォヌマンスに加えお、ディスクスペヌスのより効率的な䜿甚や䌁業のストレヌゞに固有のさたざたな機胜など、他の倚くの利点もありたす。 さらに、蚈算ノヌドずストレヌゞノヌドは、互いに独立しおスケヌリングできたす。 たた、Hadoopのいく぀かの異なるバヌゞョンずディストリビュヌションから同じデヌタに同時にアクセスするこずもできたす。



All Articles