はじめに
ハイパフォーマンスコンピューティングクラスタ(VVK)は、さまざまな分野の純粋な科学とハイテクビジネスの両方で使用されています。
- バイオインフォマティクス(ゲノムのデコードと分析、システム生物学、個々の医薬品を含む新薬の開発);
- 石油およびガスと鉱業におけるフィールドモデリングと地震データ処理。
- リソース集約型の分析とBigData
- 業界では、流体力学や空力、化学工業、新しい複合材料の開発などの問題を解決します。
VVKは、IBM、SGI、DEC、Sun、HP、Cray、NEC、Hitachi、Siemens、Bullなどの大手IT市場企業が提供する大型スーパーコンピューターの代替品として、90年代後半に急速に開発を開始しました。 90年代後半のVVKと従来のスーパーコンピューターの最も顕著な違いは、単一のOSの欠如であり、その結果、コンピューティングシステムの組織の異なる構造です。
従来のスーパーコンピューターと比較して、VVKは比較的安価(平均で10倍、他のすべてのものは同等)ですが、これらのシステムは非常に高価です:
- 資格のある専門家のチームによるサービス、冷却、中断のない電力、高速ネットワーク接続を備えた特別なプラットフォームが必要です。
- 特定のVVCごとにカウントソフトウェアの統合と付随するソフトウェア(スイッチング環境、コンパイラ、ライブラリ、スケジューラなど)のインストールは個別の困難なタスクであり、最初は思っていたよりもはるかに複雑になることがよくあります(これは一般的に統合に一般的です)。
- 商用クラスターソフトウェアライセンスのコストは、クラスター自体のコストの何倍も高くなる場合があります(たとえば、地球物理学では、商用ソフトウェアライセンスのコストは、1コンピューティングノードあたり年間4万米ドルから開始できます)。
したがって、12個程度のノード、低遅延ネットワーク、データストレージシステムを備えた比較的小さなIHCでさえ、非常に高価なツールであり、堅実なIT予算を抱える企業が利用できます(たとえば、1000コアの一般的なクラスターは年間メンテナンスで約50万米ドルの費用がかかりますUS $ 100〜15万)。 しかし、大規模なIT予算の場合でも、クラスターの購入と起動には数か月かかり、VVKの一般的な使用でソフトウェアをセットアップし、アクセスを整理するのに問題があります。
現代のクラウドプロバイダーは、原則として、単一の仮想サーバーの販売、または小規模グループに焦点を当てていますが、IHCまたは同様のシステムのリース期間には焦点を当てていません。 これらの傾向の結果、動的な中小企業は、そのニーズのためにVVKの短期リースの可能性を事実上奪われています(たとえば、コンピューティングテクノロジーのテストとパイロット実装、ビジネスにおけるシステムのモデリング、小規模の場合のピーク負荷の除去など)。 。
HPC HUBからの仮想VVK
HPC HUBの私たちは、低レイテンシネットワークを備えた10-20ノードの小規模IHCと、短期モード(日、週、月)の排他モードでのテラバイトクラスのデータストレージシステムを必要とするニッチな消費者の問題を解決することに努力を集中することにしました。 会社の主なサービスは、仮想IHC(2番目の名前:仮想スーパーコンピューター-vSC)のレンタルです。 ユーザーの観点から見ると、vSCは、ヘッドコントロールノード、低遅延ネットワークを備えた複数のコンピューターノード、GFS2に実装された50GB〜10TBのストレージで構成される通常のクラスターです。 ノードはNATを介したインターネットアクセスを持ち、外部からの制御ノードへのアクセスはポート22で開かれ、トンネリング仮想マシンのポートにリダイレクトされます。
異なるvSCは互いに分離されているため、ユーザーはvSCにインストールされているソフトウェアを完全に制御できます。 必要に応じてカスタマイズおよび変更できます。 基本vSCイメージはCentOS 7.1上に構築され、IB OFED 3.3ドライバーとSGE 8.1.3ジョブ管理システムを使用します。 作業の最後に、ユーザーはコントロールノードとコンピューティングノードの1つの状態のスナップショットを作成できます。 このスナップショットを使用して、vSCユーザーの次のインスタンスを起動できます。 この場合、vSCスナップショットは、任意の数のコンピューティングノードに拡張できます。
vSCの実装は、OpenStackクラウドソフトウェアとCephストレージに基づいています。 ユーザーマシンの仮想マシンは、KVMハイパーバイザーによって管理されます。 低遅延ネットワークの仮想化には、SR-IOVテクノロジーが使用されます。 Infinibandアダプターの仮想機能の1つが、カウントノードの仮想マシンにインポートされます。
このアプローチにより、仮想化されたInfinibandのレイテンシーの最小増加を実現できます-仮想化なしのInfinibandの0.85μsに対して、1.09μsのIB VFレイテンシー。 仮想カウントノードのプロセッサのトポロジと特性は、物理ノードと可能な限り類似しており、NUMA拡張機能がサポートされています。 GFS2を使用したvSCインスタンスのボーレートのすべてのノードの一般的な集計値は、読み取りで1.5-2 Gb / s、書き込みで350-450 Mb / s、10,000-12,000 IOPSです。
vpcのリースと展開は、hpchub.netから数分以内に実行できます。 現在、最小レンタル期間は1日ですが、クラウドの成長に伴い、近い将来、より短い充電期間に切り替える予定です。 これにより、スーパーコンピューター施設へのアクセスの大規模な組織に関連する不快な制限がなくなります。
結論
HPC HUB仮想コンピューティングクラスターにより、ユーザーは多大な時間と初期投資なしでテラフロップクラスVVCにアクセスできます。 同時に、ユーザーはこのIHCのソフトウェアをタスク専用に構成できます。これは、公共システムでの同様の手順よりもはるかに簡単です。 直接的な目的に加えて、計算を実行するために、当社の仮想化IHCは市場に以前は存在しなかった多くの重要な機会をもたらします。
- アプリケーションの開発とテストのための仮想化IHCの使用。
- 高速で簡単にスケーラブルなデモサイトとしてVVKを使用します。
- クラスタソフトウェア「小売」(短期レンタルソフトウェア)の販売のためのVVKの使用。
仮想スーパーコンピューターは、以前はアクセスできなかった中小企業のセグメントのメーカーがクラスターソフトウェアを配布および販売するのに特に役立ちます。 次のような機能:
- 柔軟性
- 簡単なスケーリング
- このソフトウェアのライセンスをわずかな時間でリースする機能を備えた、プリインストールされた複雑なクラスターソフトウェア
クラスターソフトウェアプロデューサーは、ピーク負荷時に大きなIT予算を抱えるユーザーだけでなく、スタートアップ、ベンチャーキャピタル企業、さらには学術環境や政府機関のユーザーなど、1回限りのプロジェクトを持つさまざまなユーザーをカバーするのに役立ちます。