状況:仮想GPUのパフォーマンスは、鉄のソリューションに劣りません

2月に、スタンフォード大学は高性能コンピューティング(HPC)に関する会議を開催しました。 VMwareの代表者は、GPUを使用する場合、修正されたESXiハイパーバイザーに基づくシステムは、ベアメタルソリューションに比べて速度が劣らないと述べました。



これを実現する技術について話します。





/写真Victorgrigas CC BY-SA



パフォーマンスの問題



アナリストによると、データセンターのワークロードの約70%が仮想化されています。 ただし、残りの30%は、ハイパーバイザーなしのベアメタルで動作します。 これらの30%の大部分は、たとえばニューラルネットワークのトレーニングやグラフィックプロセッサの使用に関連する負荷の高いアプリケーションで構成されています。



専門家は、抽象化の中間層としてのハイパーバイザーがシステム全体のパフォーマンスに影響を与える可能性があるという事実によって、この傾向を説明しています。 5年前の研究では、速度が10%低下したというデータ見つけることができます 。 したがって、企業やデータセンターのオペレーターは、HPCの負荷を仮想環境に急いで移行する必要はありません。



しかし、仮想化技術は進化し、改善しています。 VMwareは1か月前の会議で、ESXiハイパーバイザーがGPUのパフォーマンスに悪影響を及ぼさないと述べました。 計算速度は3パーセント低下する可能性があり、これはベアメタルに匹敵します。



仕組み



GPUを備えたHPCシステムのパフォーマンスを向上させるために、VMwareはハイパーバイザーの動作にいくつかの変更を導入しました。 特に、彼はvMotion機能を削除しました。 ロードバランシングに必要であり、通常はサーバーまたはGPU間で仮想マシン(VM)を転送します。 vMotionを無効にすると、各VMに特定のグラフィックプロセッサが割り当てられるようになりました。 これにより、データ共有コストを削減できます。



システムのもう1つの重要なコンポーネントは、DirectPath I / O テクノロジです。 並列コンピューティングのCUDAドライバーは、ハイパーバイザーをバイパスして、仮想マシンと直接対話できます。 同じGPUで複数のVMを実行する必要がある場合、GRID vGPUソリューションがアクティブになります。 メモリカードをいくつかのセグメントに分割します(ただし、計算サイクルは分割されません)。



この場合の2つの仮想マシンの動作スキームは次のようになります。









結果と予測



同社TensorFlowに基づいて言語モデルをトレーニングすること により ハイパーバイザーテストを実施ました 。 生産性に対する「損傷」は、ベアメタルと比較して3〜4%にすぎません。 同時に、見返りに、システムは現在の負荷に応じてオンデマンドでリソースを分散することができました。



ITの巨人は、コンテナーテスト実行しました 。 同社のエンジニアは、画像を認識するようにニューラルネットワークを訓練しました。 同時に、1つのGPUのリソースが4つのコンテナーVMに分散されました。 その結果、個々のマシンのパフォーマンスは17%低下しました(GPUリソ​​ースへのフルアクセスを持つ1つのVMと比較して)。 ただし、1秒間に処理される画像の数は3倍に増加しました。 このようなシステム 、データ分析およびコンピューターモデリングの分野で用途を見出すことが期待されています。



VMwareが遭遇する可能性のある問題の中で、専門家かなり狭い対象ユーザーを選び出します。 現在、少数の企業が高性能システムを使用しています。 Statista 2021年までに、世界のデータセンターのワークロードの94%が仮想化されると指摘しています。 アナリストによる 、HPC市場の価値は2017年から2022年の間に32億ドルから450億ドルに成長するでしょう。





/写真グローバルアクセスポイント PD



同様のソリューション



市場には、大手IT企業によって開発されたAMDとIntelのアナログがいくつかあります。



最初のGPU仮想化会社 、SR-IOV(シングルルート入力/出力仮想化)アプローチを提供します。 このテクノロジーにより、VMはシステムのハードウェア機能の一部にアクセスできます。 このソリューションを使用すると、同等のパフォーマンスの仮想化システムを持つ16人のユーザーにグラフィックプロセッサを分割できます。



2番目のIT巨人に関しては、その技術は Citrix XenServer 7ハイパーバイザーに基づいています。これは、標準のGPUドライバーと仮想マシンの動作を組み合わせて、数百のユーザーのデバイスで3Dアプリケーションとデスクトップを表示できるようにします。



未来の技術



仮想GPU開発者 、AIシステムの実装と、ビジネステクノロジー市場での高性能ソリューションの人気の高まりに賭けています。 彼らは、大量のデータを処理する必要性がvGPUの需要を増やすことを望んでいます。



現在、メーカー 、グラフィックス、数学計算、論理演算、データ処理に関連するタスクのソリューションを高速化するために、1つのコアでCPUとGPUの機能組み合わせる方法を探しています。 将来、このようなコアが市場に登場することで、リソース仮想化のアプローチと、仮想環境とクラウド環境のワークロード間でのそれらの分散が変わります。






企業ブログのトピックに関する読み物:





Telegramチャンネルからの投稿:






All Articles