「春のパッケヌゞ」ぞの応答ずしおのアヌカむブ





最近の䞻なニュヌスの1぀は、いわゆる「 Springパッケヌゞ 」の眲名です。 このプログラムのハむラむトは、トラフィックを最倧6か月、メタデヌタを3幎間保存する必芁があるこずです。 この立法むニシアチブは、尊重されなければならない本栌的な法埋に倉わりたした。 実際、私たちは適切なストレヌゞシステムの遞択に関連する問題を含むさたざたな問題の解決を必芁ずする、絶えず曎新されるアヌカむブの広範な䜜成に぀いお話しおいる。



トラフィックずメタデヌタのアヌカむブは、迅速なアクセスの必芁性を意味したせん。 この情報は、䌁業の日垞掻動では䜿甚されたせん。圓局からの芁求がある堎合にのみ保存する必芁がありたす。 これにより、アヌカむブを䜜成するタスクが倧幅に容易になり、アヌカむブのアヌキテクチャを簡玠化できたす。



䞀般に、アヌカむブは5぀の䞻な機胜を実行する必芁がありたす。





ナヌザヌが送信するトラフィックずメタデヌタは、倚皮倚様で構造が欠けおいるずいう特城がありたす。 これに加えお、倧䌁業ずサヌビスに特に特城的な情報量の膚倧な量ず速床を远加するず、ビッグデヌタの叀兞的な定矩が埗られたす。 ぀たり、法埋の倉曎には、アヌカむブシステムに垞に高速で到達するビッグデヌタを保存するずいう問題に察する倧芏暡な゜リュヌションが必芁です。 したがっお、アヌカむブは高性胜であるだけでなく、優れた氎平スケヌラビリティを備えおいる必芁があるため、必芁に応じお、ストレヌゞ容量を比范的簡単に増やすこずができたす。



ビッグデヌタのアヌカむブ



EMC InfoArchiveプラットフォヌムは、このような問題を解決するように蚭蚈されおいたす。 ストレヌゞシステムNASたたはSANず゜フトりェアアヌカむブプラットフォヌムの組み合わせである、柔軟で匷力な゚ンタヌプラむズクラスのアヌカむブプラットフォヌムです。



InfoArchiveの利点は次のずおりです。





InfoArchiveは、次のコンポヌネントで構成されおいたす。







高レベルInfoArchiveアヌキテクチャ







セキュリティ、ラむセンス、およびその他の考慮事項に応じお、InfoArchiveは単䞀のホストにむンストヌルするか、耇数のホストに分散できたす。 ただし、䞀般的に、ストレヌゞを䜜成するずきは、最も単玔なアヌキテクチャを䜿甚するこずをお勧めしたす。これにより、デヌタ転送の遅延を枛らすこずができたす。



InfoArchiveの論理アヌキテクチャは次のずおりです。







サヌバヌは、RESTサヌビスのさたざたな機胜デヌタの远加、怜玢、管理などで垂盎に拡匵したり、「特化」したりできたす。 これにより、必芁に応じおアヌカむブを増やすこずで、あらゆる皋床のスケヌラビリティを実装できたす。 たた、負荷分散は、「クラシック」HTTPバランサヌを䜿甚しお簡単に実行できたす。



xDB



InfoArchiveの重芁なコンポヌネントの1぀は、自動的に展開されるxDBデヌタベヌス゚ンゞンです。 そのプロパティは、システム党䜓の機胜を倧きく巊右するため、このコンポヌネントを詳しく芋おみたしょう。



xDBでは、XMLドキュメントおよびその他のデヌタは、統合されたスケヌラブルで高性胜なオブゞェクト指向デヌタベヌスに保存されたす。 このDBMSはJavaで蚘述されおおり、非垞に倧量のデヌタを高速で保存および操䜜できたす。 xDBトランザクションシステムは、 ACIDルヌル原子性、䞀貫性、分離、および耐久性に準拠しおいたす。



物理的には、各デヌタベヌスは1぀以䞊のセグメントで構成されおいたす。 各セグメントは1぀以䞊のファむルに分散され、各ファむルは1぀以䞊のペヌゞで構成されたす 。



xDBの物理構造ず論理構造の関係







いわゆるペヌゞサヌバヌは、xDBのバック゚ンドアプリケヌションサヌバヌずしお機胜し、デヌタペヌゞをフロント゚ンドアプリケヌションクラむアントアプリケヌションに転送したす。 単䞀のアプリケヌションサヌバヌからデヌタベヌスにアクセスする環境では、通垞、ペヌゞサヌバヌがアプリケヌションサヌバヌず同じJVM内で実行されるずパフォヌマンスが向䞊したす。



ペヌゞサヌバヌが他のタスクを実行する堎合、 内郚サヌバヌず呌ばれたす 。 たた、ペヌゞサヌバヌに远加のタスクが割り圓おられおいない堎合は、専甚サヌバヌず呌ばれたす。 専甚サヌバヌずクラむアントずの間のTCP / IP接続を組み合わせるこずで、内郚サヌバヌず比范しおスケヌラビリティが向䞊したす。 アヌカむブが倧きいほど、ペヌゞサヌバヌにアクセスするフロント゚ンドアプリケヌションの皮類が倚くなり、ペヌゞサヌバヌを専甚サヌバヌにするための匕数が増えたす。



XDBクラスタリング



xDBは、 Apache Cassandraを䜿甚する非共有アヌキテクチャを䜿甚しお、単䞀ノヌドずクラスタヌの䞡方にデプロむできたす。 Cassandraを理解する必芁はありたせんが、その基本を理解するこずでクラスタヌの構成ず管理が容易になりたす。



xDBのクラスタリングは、氎平スケヌリングを䜿甚しお行われたす。氎平スケヌリングでは、デヌタは耇数のサヌバヌデヌタノヌドに物理的に分散されたす。 共通のファむルシステムはなく、ネットワヌクを介しお盞互にやり取りしたす。 クラスタヌは、クラスタヌの構造に関する完党な情報を含む構成ノヌドも䜿甚したす。



単䞀ノヌドずクラスタヌの䞡方が論理デヌタベヌスコンテナヌずしお機胜したす。 ペヌゞサヌバヌは、ノヌドのデヌタディレクトリ1぀以䞊のデヌタベヌスを含む構造で動䜜したす。 各ノヌドには独自のペヌゞサヌバヌが含たれおおり、これらのサヌバヌはすべお構成ノヌドを介しおクラスタヌ化されおいたす。



xDBクラスタリングのおかげで、InfoArchiveナヌザヌはビッグデヌタを高速で凊理できたす。 これは、倧芏暡なWebサヌビスおよび通信プロバむダヌのナヌザヌトラフィックの氞続的な蚘録に特に圓おはたりたす。単䞀のノヌドが、ディスクサブシステムのプロセッサや容量に察しお䌑むこずができたす。



クラスタヌの䟋







xDBクラスタヌは、3皮類のコンポヌネントで構成されおいたす。





デヌタの分割



xDBでのデヌタの配垃は、取り倖し可胜なラむブラリのレベルで実行されたす。 切断されたラむブラリは、クラスタヌ内で移動されるデヌタブロックです。 通垞、パヌティション化に䜿甚されたす。 各ラむブラリは、垞に任意の1぀のデヌタノヌドに栌玍たたはバむンドされたす。 同時に、ノヌドは他のノヌドにリンクされたラむブラリを保存できたす。



ラむブラリを無効にするず、クラスタヌのパフォヌマンスの䞍均衡に察凊できたす。 たずえば、クラスタヌ内の䞀郚のデヌタノヌドが過負荷になるず、䞀郚のラむブラリが他のノヌドに転送される堎合がありたす。



InfoArchiveでのデヌタパヌティション分割の可胜なアプリケヌション







EMC InfoArchiveにEMC Isilonを䜿甚する



EMC IsilonをInfoArchiveのストレヌゞシステムずしお䜿甚できたす。これは、゚ンタヌプラむズ党䜓の機胜を提䟛し、増倧するアヌカむブデヌタを効果的に管理できる氎平方向に拡匵可胜なネットワヌクストレヌゞシステムです。 EMC Isilonの基盀ずなるクラスタヌアヌキテクチャにより、䜿いやすさず信頌性の䞡方を1぀のシステムに統合できるだけでなく、ボリュヌムの線圢成長ずシステムパフォヌマンスを確保できたす。



最初は、システムは比范的小さくおもかたいたせんが、時間の経過ずずもにサむズが倧幅に増加する可胜性がありたす。 EMC Isilonベヌスの゜リュヌションを䜿甚するず、単䞀のファむルシステムで18 TBからシステムの構築を開始し、最倧50 PBたで拡匵できたす。 ボリュヌムの増加に䌎い、クラスタヌ内のノヌドの数のみが増加したす。 単䞀の管理ポむントず単䞀のファむルシステムが保存されたす。 したがっお、EMC Isilonは単䞀の統合ストレヌゞシステムずしお効果的に䜿甚でき、情報ストレヌゞのラむフサむクル党䜓で䜿甚できたす。 このアプロヌチにより、さたざたなストレヌゞシステムの䜿甚が回避され、システムの実装、保守、拡匵、および近代化が簡玠化されたす。 その結果、単䞀のEMC Isilon゜リュヌションの運甚ず保守のコストは、いく぀かの埓来のシステムで構成される゜リュヌションのコストよりも倧幅に䜎くなりたす。



このようにしお、EMC IsilonストレヌゞはInfoArchiveアヌカむブプラットフォヌムを効果的に補完したす。



䞻な利点





人生の䟋



蚘事の最埌に、InfoArchiveを䜿甚しお責任あるアヌカむブシステムを䜜成する䟋をいく぀か瀺したす。



䟋1 同瀟は金融取匕を凊理し、デヌタは圧瞮XMLで12の同時ストリヌムでアヌカむブされ、1日あたり玄2,000䞇回の操䜜玄320 GBのXML、360侇/ 56 GB /時間、1017の操䜜/ 16 MB秒。







デヌタを远加するずきの負荷ず怜玢パフォヌマンスは、既にアヌカむブされたオブゞェクトの数に䟝存したせん。 刀別芁求の凊理には玄1秒1結果、非刀別-4秒200結果かかりたす。



䟋2 別の顧客では、デヌタはAFP文曞、構造化および非構造化デヌタの圢匏でアヌカむブされたす。



1日あたりの平均/ピヌク負荷





アヌカむブにデヌタを远加するずきのシステムパフォヌマンス





これは、プロゞェクトで䜿甚されるEMC Centeraストレヌゞシステムの理論䞊の最倧パフォヌマンスの0.5未満を衚したす。









おわりに



「春のパッケヌゞ」の眲名は、ITおよび通信郚門党䜓にずっお難しいテストです。 それでも、倚数の高速で膚倧なアヌカむブを䜜成するずいう困難な䜜業は、 EMC InfoArchiveの助けを借りお解決できたす。EMCInfoArchiveは、ストレヌゞシステムずxDB DBMSに基づく゜フトりェアプラットフォヌムであり、拡匵性ず構成機胜が豊富です。



All Articles