Huawei KunLun Server-テスト

まず、KunLunアーキテクチャに関するいくつかの言葉-ロシア語のセグメントには、KunLunアーキテクチャに関する情報はほとんどありません。 KunLunはハイエンドプラットフォームとして作成されたため、そのすべてのコンポーネントが複製されます(NUMAノードの制御モジュールとコントローラーを含む)。 ただし、サーバーのハイエンドコンポーネントの複製はこれに限定されません。このソリューションにより、OSはPCIeカード(これは原則的に新しいものではありません)だけでなく、メモリを搭載したプロセッサの交換も停止できます。 システムは、障害を待つことなく、すぐに障害が発生する可能性があるコンポーネントを事前に通知します。 OSを停止せずに交換できます。 現在、プロセッサとメモリモジュールのホットスワップは、EulerOS OS(HuaweiのCentOS)でのみ提供されています。 RHELおよびSLESについては、すぐに使用できるサポートがまもなく約束されます。



スイッチングシステムを介した1つのプロセッサと24のメモリモジュールを含むサーバーマザーボードは、4、8、16、または32プロセッサの物理パーティションに結合されます。 粒度を低くするには、論理パーティション(ハイパーバイザー)を適用する必要があります。



サーバーには、各バケット内にハードウェアRAIDを作成する機能を備えた組み込みディスク(各12ディスクのバスケットが最大4つ)も装備されています。 場合によっては、これは外部ディスクアレイなしで実行できます。



KunLunの主な機能は何ですか? 1つのパーティションで最大32個のIntel Xeonプロセッサと最大24 TBのメモリを組み合わせることができます。 ボーナスとして、システムはHuaweiのBIOSを使用しており、ベンダーはソフトウェア認証のソースコードを提供する準備ができています。



すべてのメーカーが32プロセッサシステムを提供できないのはなぜですか?



Intelプロセッサの標準的な手段では、1つのサーバーに8つまでのプロセッサを組み合わせることができます。 特別なデバイス-NUMAノードのコントローラー(ノードコントローラー)を作成することによってのみ、さらに組み合わせることができます。 Intelはそれらを生成しませんが、この機能を使用する可能性はQPIバスに組み込まれています。 これはHP、SGI、Huaweiで使用され、各メーカーが独自のコントローラーを作成しました。 このようなコントローラーの作成の背後には、大規模な科学活動とそれに関連するコストがあることは明らかです。 たとえば、ファーウェイの開発には8年かかりました。



残りのベンダー(およびその中のIntel)は、コントローラーの開発を拒否しました。 理由は? 第一に、プロセッサの数が増えると、メモリの処理速度が低下します。 これは主に、プロセッサキャッシュのステータスを同期する必要があるためです。より多くのプロセッサがメモリの一部をキャッシュするほど、プロセッサの1つがそれを変更した場合により多くのアラートが必要になります。 2番目の理由-大部分のコンピューティングタスクでは、1〜4個のプロセッサで十分です。



EulerOS



製造業者は、プロセッサとメモリをその場で交換する可能性を主張しています。 これには、専用のOSであるEulerOSが必要です。 インターネット上では、それに関する情報は非常に少なく、主にLinux Standard Baseの最新バージョンによる認定に関するものです。 実際、EulerOSはRHELソース-Red Hat Enterprise Linux(CentOSに類似)から組み立てられたことが判明しました。 Huaweiは、特にCPU / RAMホットスワップドライバーを追加することにより、機器に合わせてカスタマイズします。



EulerOSに加えて、KunLunはWindows Server 2012のRHEL、SLES 11および12のサポートを発表しました。



SPECint / SPECfpパフォーマンステスト



KunLunは算数でうまくやっています。 SPECint中、プロセスは特定のカーネルにバインドされ、ローカルメモリでのみ動作します。

サーバー





スペント





スペフ





SGI UV 300(32x、Intel Xeon E7-8890 v3)





22600





15700





KunLun 9032(32x-Intel Xeon E7-8890 v3)





22900





16300





IBM Power E880(16 x Power8 4.0 GHz、192コア)





14400





11400





KunLun 9016(16x-Intel Xeon E7-8890 v3)





11700





8050





SGI UV 300(16x、Intel Xeon E7-8890 v3)





11400





7880





Integrity Superdome X(16x、Intel Xeon E7-8890 v3)





11100





7670







KunLunと最上位のIBM Power E880(16プロセッサー)との比較は興味深いものでした-それらの間のギャップはそれほど広くありません。 つまり、Intel Xeonコンピューティングの分野では、HuaweiサーバーはPower8とかなり競合しています。



SLOBパフォーマンステスト(Oracle)



ここでは、計算の速度ではなく、メモリへのアクセスの速度を測定しました。 DBMSプロセスはNUMAノードに関連付けられていません;テストでは、すべてのメモリはプロセッサから等距離にあると見なされます。 テスト結果は、リソースの追加に対するサーバーのパフォーマンスの依存性が非線形であることを確認しました。



プロセッサ容量が7倍に増加したため(周波数の低下を考慮して16コアから144コアに)、サーバーのパフォーマンスが5倍向上しました(効率71%)。 コア数が16倍(4 CPU)から64(16 CPU)に4倍増加すると、生産性は2.7倍(68%の効率)向上しました。



アプリケーションKunLun



KunLunの主な利点は、搭載されているメモリの印象的な量です(現在24 TB、将来32 TB)。 これは、データベース全体がRAMに配置されるインメモリ分析の場合に特に当てはまります。 KunLunを使用すると、ハードドライブと比較してデータアクセス時間を3桁短縮できます。つまり、データベースクエリを高速化します。 KunLunは、SAP HANAおよびSAP S / 4HANAに適しています。 メモリ量により、単一ノードのKunLun構成でもHANAを使用できます。 Oracle Database(特にIn-Memoryオプションを使用)およびQlikViewも、中国のスーパーサーバーで適切に表示されます。



小売業者は、このソリューションをSAP HANAのプラットフォームとして使用して、特定の商品に対する顧客の需要、在庫残高などに関する大量のデータを分析できます。 Oracle In-Memory OptionとKunLunの組み合わせは、銀行がその場で信用力を評価し、自己資本比率を計算するのに役立ちます。 このソリューションに基づいた通信事業者は、加入者ロイヤルティの管理(プロファイルの形成、ターゲティング)を実装できます。



さらに、KunLunはx86ベースのRISCシステムを置き換えることができます。 一部の企業では、過去のx86サーバーを超えてRISCで実行された垂直方向にスケーラブルなタスクが関連しています。 同時に、KunLunのコストとRISCシステムの年間メンテナンスの価格の間に等号を付けることができます。 KunLunは信頼性の点で彼らに劣らず、さまざまなアプリケーションソフトウェアで勝ちます。 KunLunは自宅で、主にRISCシステムからの移行のプラットフォームとして、輸入代替に積極的に使用されていることは注目に値します。



この記事は、Jet Infosystems Computer Design CenterのシステムアーキテクトであるDmitry Glushenkoによって作成されました。 建設的なコメントを歓迎します。



All Articles