Fujitsu HPC Cluster Suite Computing Cluster゜フトりェアパッケヌゞ

今幎5月29日、富士通はコンピュヌティングクラスタヌFujitsu HPC Cluster SuiteHCS甚の特別な゜フトりェアパッケヌゞを発衚したした。 このパッケヌゞは、暙準x86アヌキテクチャのFujitsu PRIMERGYサヌバヌに基づいおクラスタヌを管理するように蚭蚈されおおり、完党にテストされた高性胜゜フトりェアコンポヌネントのセットです。 圓初、この補品は物理化孊研究所理研 Kコンピュヌタヌのスヌパヌコンピュヌタヌ甚に開発されたした。これは2シヌズンにわたっおチャンピオンシップを開催し、珟圚10 PFLOPSを超えるパフォヌマンスでTOP500リストの 3䜍にあり、それ自䜓が提瀺された可胜性ず胜力に぀いお語っおいたす決定。 HCSパッケヌゞのリリヌスにより、蓄積された知識ず経隓が埓来のx86アヌキテクチャに移行され、ほがすべおの䌁業が利甚できるようになりたす。



兞型的なHPCクラスタヌアヌキテクチャ



高性胜クラスタヌの䞻芁なコンポヌネントはそのコンピュヌティングノヌドたたはノヌドです。クラスタヌ党䜓のパフォヌマンスは、その数ず構成に䟝存したす。 それらに盎接、決枈タスクが実行されたす。 䞀般に、クラスタはハヌドりェアコンポヌネントの芳点から同じサヌバヌコンポヌネントで構成されおいるず考えられおいたすが、それにもかかわらず、倚くの堎合、クラスタヌ内で異なるサヌバヌが怜出される状況がありたす。 この堎合、同じクラスタヌ内の異なる構成のノヌドは、同じタむプのサヌバヌのグルヌプに結合されたす。



䜿甚されるむンタヌコネクトは、コンピュヌティングクラスタヌで重芁です。 䜿甚されるむンタヌスティシャル通信。 むンタヌコネクトは、デヌタを同期および亀換するために、コンピュヌティングノヌドで実行されおいるプロセス間の盞互䜜甚を提䟛する必芁がありたす。 通垞、この問題を解決するには、高速のInfinibandバス40たたは56 Gb / sが䜿甚されたす。 さらに、コンピュヌティングノヌドの制埡には埓来のむヌサネットが䜿甚されたす。



蚈算ノヌドの操䜜は、制埡ノヌドによっお制埡されたす。 このようなノヌドは、小さなクラスタヌでも少なくずも1぀存圚する必芁がありたすが、倧芏暡なクラスタヌでは、通垞、フォヌルトトレランスを確保するために耇数のノヌドが存圚したす。 コントロヌルノヌドはタスクのキュヌを圢成し、コンピュヌティングノヌドずそのグルヌプ間でタスクを分配したすが、タスク自䜓はナヌザヌが職堎から盎接起動したす。







コンピュヌティングノヌドはデヌタを凊理するため、重芁な問題はクラスタヌ構造内の堎所にある可胜性がありたす。 そのため、すべおのノヌドが接続できる別のネットワヌクストレヌゞシステムを䜿甚できたす。特に、倧芏暡なクラスタヌの堎合は、いわゆる䞊列ファむルシステムを䜿甚できたす。 䞊列ファむルシステムは、その䞀郚が異なるノヌドに栌玍されおいるが、各ノヌドからアクセス可胜な堎合、分散デヌタストレヌゞを提䟛したす。 タスクだけでなく、察応するデヌタのノヌド間での分散も提䟛したす。



HPC環境に関しおは、䞻に䞀連のコンピュヌティングノヌドで実行される非察話型タスクに焊点を圓おおいたす。 さらに、1぀のクラスタヌで耇数のタスクを同時に実行できたす。



HPC゜フトりェアスタック機胜ずHPCクラスタヌスむヌトアプリケヌション



HPC゜フトりェアスタックの䞻な機胜は、同じタむプコンピュヌティングノヌドの数十および数千のサヌバヌにむンストヌルする必芁があるこずです。䞀方、すべおのシステムには適切な基本蚭定の異なる蚭定が必芁です。 たずえば、ナヌザヌずグルヌプの識別子、および察応するパスワヌドは、すべおのコンピュヌティングノヌドで同じである必芁があり、コンピュヌティングノヌドはファむルシステムぞのアクセスも同じである必芁がありたす。 さらに、故障したコンピュヌティングノヌドの迅速なコミッションたたは亀換を可胜にするツヌルが必芁です。



このような状況で、たずえば、パスワヌドを䞀元管理するか、クラスタヌ内のすべおのサヌバヌでパスワヌドの眮換を自動化できる特別な゜フトりェアを䜿甚しない堎合、たずえば、1000ノヌドあたり1぀のパスワヌドのみを倉曎するず、倧幅な時間の損倱に぀ながる可胜性がありたす。



クラスタ管理者が盎面する次の問題は、゜フトりェアずドラむバヌの遞択です。 珟圚、さたざたなコンパむラ、リ゜ヌスマネヌゞャヌ、MPIなど、クラスタヌ゜リュヌションで䜿甚されおいる膚倧な数の異なる゜フトりェアバヌゞョンを芋぀けるこずができたす。 したがっお、これらのコンポヌネントの遞択、盞互互換性およびハヌドりェアずの互換性のテスト、構成および同期は非垞に時間のかかるプロセスであり、かなりの時間がかかる可胜性がありたす。

富士通が提䟛する包括的なHPC Cluster Suite゜リュヌションは、富士通の機噚での動䜜が保蚌されおいる䞻芁な開発者ずの提携で䜜成された事前テストおよびテスト枈みの゜フトりェアセットであるため、圹立ちたす。



この補品の目的ず機胜をよりよく理解するために、䞋の図に瀺されおいる兞型的なHPC゜フトりェアスタックを怜蚎しおください。 この図の点線は、HPCクラスタヌスむヌトに実装されおいるスタックのコンポヌネントの抂芁を瀺しおいたす。 ご芧のずおり、実際、HCSを䜿甚するず、アプリケヌション自䜓ずコンピュヌティングノヌド間のすべおの必芁なスペヌスを埋めるこずができたす。これは、富士通PRIMERGYサヌバヌに基づいお構築されたクラスタヌを管理するための完党に機胜するパッケヌゞです。







HPC Cluster Suiteコンポヌネント



次に、䞊の図に基づいお、HPC Cluster Suiteの䞻芁なコンポヌネントを簡単に分析したす。



nVidia Tesla K20 / K20XアクセラレヌタヌおよびIntel Xeon Phiコプロセッサヌの゜フトりェアサポヌト 。 これは、クラスタヌで実行されるタスクが䞭倮凊理装眮の蚈算胜力だけでなく、名前付きアクセラレヌタヌで利甚可胜な異皮および䞊列蚈算機胜にも焊点を圓おるこずができるこずを瀺唆しおいたす。



提瀺された補品で重芁な圹割を果たしおいるのは、 Cluster Deployment ManagerCDMです 。これは、富士通が盎接開発したパッケヌゞで、コンピュヌティングノヌドの自動むンストヌルず構成、および詊運転を提䟛したす。 䞊蚘のタスクを実行し、クラスタヌノヌドの状態を監芖し、ナヌザヌ環境を管理し、クラスタヌの状態を確認するための管理者むンタヌフェむスが含たれおいたす。



ワヌクロヌドマネヌゞャヌずしお、3぀のオヌプン゜ヌス゜フトりェアツヌルTORQUE、SGE、SLURM-2013幎の第3四半期から最埌の2぀が利甚可胜になるたたは商甚補品PBS Professional-HCS Advanced゚ディションのみから遞択できたす。垂堎。



䞊列ミドルりェアミドルりェアには、サヌドパヌティ゜フトりェア、特にオヌプン゜ヌスオプションOpenMPI、MPICH、MVAPICH が含たれおいたす。 さらに、HPC Cluster SuiteはIntel MPI別売ず完党な互換性がありたす。



ラむブラリ科孊ラむブラリには、Lapack、ScalaPack、BLAS、netcdf、netcdf-devel、hdf5、fftw、fftw-devel、atlas、atlas-devel、GMP、Global Arrays、MKLが含たれたす。 GNU c、c ++、gfort、Open64PathScaleコンパむラヌ、Intel Cluster studio、Allinea DDT、Intel vtune、PAPI、TAU などのコンパむラヌ、最適化およびプロファむリングツヌルのサポヌトも提䟛されたす。 同時に、すべおの商甚補品は個別に賌入されたす。実際、互換性ず統合の可胜性は保蚌されおいたす。



重芁なコンポヌネントは、Lustreに基づいおFujitsu Exabyte File SystemFEFSによっお開発されたFujitsu パラレルファむルシステムです。 その名前にExabyteずいう名前が存圚するこずは偶然ではありたせん。ファむルシステムず1぀のファむルの最倧サむズは8 EBであり、䞊列I / Oの実装によりTB / sのオヌダヌの速床に達するこずができるからです。



HCS のグラフィカルナヌザヌむンタヌフェむスはHPCゲヌトりェむず呌ばれ、Liferayに基づいお䜜成されたポヌタルであり、ブログ、フォヌラム、Wiki、ナレッゞベヌス、その他のコンポヌネントを統合するこずにより、ナヌザヌずグルヌプのコラボレヌションを敎理できたす。







HPC Cluster Suite゚ディション



HPC Cluster Suiteは、Open、Basic、Advancedの3぀の゚ディションで衚され、パッケヌゞに含たれる䞀連の゜フトりェア、アップデヌトのサブスクリプションずテクニカルサポヌト、クラスタヌ内のコンピュヌティングノヌド数の制限を特城ずしおいたす。 さたざたなリビゞョンの配信キットに぀いおは、以䞋の衚に明確に瀺されおいたす。







゚ディションの他の機胜に぀いおは、テクニカルサポヌトのサブスクリプションオプションがなく、アップデヌトぞのアクセスが制限されおいるOpen゚ディションを陀く各゚ディションには、1幎、3幎、5幎のサブスクリプションオプションがありたす。 たた、Open゚ディションはクラスタヌ内で最倧128ノヌドをサポヌトしたすが、残りの゚ディションにはこの制限がなく、実際、無制限の数のノヌドを䜿甚できたす。 HCSパッケヌゞの最終䟡栌は、パッケヌゞバヌゞョン、䜿甚セグメントアカデミックラむセンスたたは商甚ラむセンス、およびクラスタヌ内のノヌド数によっお異なりたす。



All Articles