高性能サーバーでのLRDIMMの使用

LRDIMM (負荷軽減デュアルインラインメモリモジュールまたは「負荷軽減DIMM」)は、2012年以降、サーバープラットフォームでサポートされているメモリモジュールの一種です。 LRDIMMはDIMMの登録に似ており、同じメモリスロットに適合します。 ただし、LRDIMMの動作原理はRDIMMとは異なります。 通常のサーバーでLRDIMMを使用すると、512GB、1TB、または1.5TBのメモリを作成できます。







メモリバッファ-LRDIMMテクノロジの基盤



レジスタDIMMは、プロセッサメモリコントローラに接続されたバスに直接接続します。 DIMMの動作モードでは、メモリコントローラーがモジュールの制御ラインに接続された各DRAMチップを制御します。 また、メモリモジュール内のこれらのチップ(いわゆるランク)が多いほど、コントローラーの電気的負荷が大きくなります。 ランク-1つのチップ選択ラインに接続されているチップセットの数。 ランクはメモリモジュールの特性です。 デュアルおよび4ランクのメモリモジュールを以下に示します。











2ランクモジュールは、プリント回路基板にはんだ付けされ、同じ物理データ伝送チャネルを順番に使用する2つの論理モジュールです。 4ランク-同様のソリューションですが、4倍の規模です。



RDIMMはレジスタメモリモジュールです。 「レジスタ」という名前は、このタイプのモジュールにバッファリングレジスタがあり、アドレスおよびコマンド信号のバッファリングに使用されることを意味します。











LRDIMMの場合、特別なメモリバッファチップがバスに接続され、各モジュールに接続されます。 コントローラがLRDIMMモジュールで動作する場合、管理はこのモジュールバッファ-iMB(アイソレーションメモリバッファ)にパケット情報(データおよびコマンド)を送信することに限定されます。 RDIMMとは異なり、制御信号だけでなくデータもバッファリングされます。











バッファは、DRAMのすべての読み取りおよび書き込み操作を管理します。 データとコマンド/アドレスの信号はそれを通過します-これはメモリコントローラー(ホストメモリコントローラー)とDRAMの間の仲介です。











新しいDRAMチップ(ランク)をレジスタDIMMに追加すると、メモリモジュールの電気的負荷が増加します。 メモリチャネルごとのランクの数が増えると、メモリのパフォーマンスが低下します(その動作速度)。 RDIMMの場合、3番目のバンクを使用するとメモリ速度が低下するため、チャネルごとに2つ以下のDIMMを取り付けることが最適です。 チャネルは、メモリモジュールからコントローラへの「パス」であり、読み取りおよび書き込みデータが送信されます。



LRDIMMはメモリバッファチップを使用するため、これらの制限はありません。 LRDIMMを使用する場合、プロセッサーのメモリコントローラーはシリアルモードで動作します。 コマンドとデータはメモリバッファに転送され、DRAMのすべての読み取りおよび書き込み操作を制御します。



乗算ランク



LRDIMMは、いわゆるランク乗算のおかげで、データバス上のDRAMチップの電気的負荷を大幅に削減します。 物理DRAMランクは、メモリコントローラーにとっては大容量の単一論理ランクのように見えます。 以下は、メモリチャネルごとに3つのLRDIMMのランク乗算を示しています。











ランクの乗算を無効にして、2:1または4:1に設定できます-LRDIMMで最大8つの物理ランク。 たとえば、メモリコントローラーの4ランクLRDIMMは2ランクLRDIMMに変換されます。 つまり、コントローラーは4ランクモジュールを2ランク、8ランクモジュールを4ランクと認識します。 このため、マルチランクモジュールの負荷は2倍低くなります。 その結果、サーバーはRDIMMよりも高速でLRDIMMをサポートできます。



電気負荷を減らすと、LRDIMMを搭載したシステムは同じ容量でより高速(メモリクロック周波数)で動作したり、RDIMMを使用した構成と同じ速度を維持しながらRAM容量を増やしたりできます。











したがって、実際には、LRDIMMを使用してメモリの速度を上げたり、容量を増やしたりすることができます。 LRDIMMは、容量が16 GBのデュアルギャングRDIMMまたは容量が32 GBの4ランクRDIMMで要件を満たしていないユーザーに、高速で大容量を提供します。



たとえば、24個のメモリスロットを備えた2プロセッササーバーは、次のように構成できます。





別の例:Intel Xeon E5 v3プロセッサには4チャンネルのメモリコントローラーが含まれ、チャンネルごとに最大8つの論理ランクをサポートします。 合計で、プロセッサごとに32 GBの最大8つの4ランクモジュールをインストールできます(チャネルごとに2つ)。 この場合のデュアルプロセッサボードのメモリ容量は512 GBを超えることはできません。 ピアツーピアモジュールまたはピアツーピアモジュールは、チャネルごとに最大3つ配置できますが、容量は少なくなります。



メモリコントローラーが2ランクと認識する4ランクLRDIMMモジュールを使用する場合、プロセッサあたり32 GBの最大12個のモジュールを取り付けることができます。合計768 GBのメモリがより高い周波数で動作します。 現在、64ギガバイトと128ギガバイトのLRDIMMがあります。これにより、サーバー上で最大1.5〜2 TBのメモリを確保できます。



LRDIMMとDIMMを組み合わせることができないことに注意してください-システムは単に起動しません。



LRDIMMの機能



RAMの容量と速度の向上に加えて、LRDIMMアーキテクチャには他にも多くの便利な機能があります。 iMB、LRDIMMメモリバッファ、DRAMおよびLRDIMMテストツールをサポートします。これには、透過モードとMemBIST(メモリ組み込み自己テスト)、データバス(DQ)のVREF(電圧リファレンス)、コマンド/アドレス(CA)、パリティコマンド、統合制御、RDIMMのレジスタ32882と同様、LRDIMM構成およびステータスレジスタ用のオプションのSMBusインターフェイス(シリアル管理バス)、および統合温度センサー。



トランスペアレントモード:メモリモジュールのテストに使用されます。 モジュールはバッファのように機能し、信号とデータをDRAMチップに転送します。



MemBIST: DRAMを初期化し、コンポーネントをテストするために、LRDIMMはMemBIST(Memory Built-In-Self Test)機能をサポートしています。 DRAMを完全にテストするのに役立ちます。 テストは動作周波数で実行され、アクセスはコマンド/アドレスバスまたはSMBusを介して使用されます。



VREF: LRDIMMは、メモリバッファーからのデータ(VREFDQ)およびコマンド/アドレス(VREFCA)または内部の外部電圧パラメーターを使用できます。 VREFがメモリバッファによって設定されている場合、ホストメモリコントローラが電圧レベルを制御できます。 このために、メモリバッファ構成レジスタが使用されます。 プログラム可能な電圧レベルにより、メモリモジュールおよびシステムコンポーネントのサプライヤは、LRDIMMメモリインターフェイスの信頼性と堅牢な動作を保証できます。



パリティチェック:コマンド/アドレスバス上の歪んだコマンドを検出するために、メモリバッファ内の着信コマンドに対してパリティチェックが実行されます。 エラーの場合、信号ERROUT_nが生成されます。



SMBusインターフェイス:メモリバッファは、帯域外シリアル管理バス制御をサポートします。 ステータスレジスタからデータを読み書きできます。



温度センサー:メモリバッファーに統合され、1秒間に8回更新されます。 SMBusインターフェースからアクセスできます。 バッファのピンEVENT_nを使用して、高温に関するメッセージをメモリコントローラに送信できます。



LRDIMMを「オーバークロック」する方法は?



バッファなしのデータバスは、RDIMMメモリシステムの弱いリンクのままです。 たとえば、4ランクDDR3 RDIMMは、データバス上の4つの電気負荷です。 したがって、4ランクDDR3 RDIMMの最大速度は、「チャネルあたり1つのDIMM」(1つのDPC)の構成で1066 MT / s(1秒間に100万トランザクション)、構成「チャネルあたり2つのDIMM」(2つのDPC)で800 MT / sです。 LRDIMMでは、バッファはデータバスとコマンド/アドレスバスの両方を使用します。 これにより、データ転送速度とメモリ密度を高めることができます。



次の図は、「チャネルあたり2 DIMM」構成の4ランクRDIMMのデータバス図を示しています。 データバスに8つの電気負荷があると、メモリチャネルの信号の整合性が大幅に低下し、周波数が制限されることを示しています。 8つの電気負荷と1333 MT / sで、バス上の最大「データアイ」は理想的なVREFポイントで212 psに減少し、最大電圧で115 mVを超えません。 「データウィンドウ」とは、コントローラーがデータを読み取ることができる期間であり、この期間は、メモリが動作する頻度が増加するにつれて短くなります。









データウィンドウの圧縮効果は、「チャネルあたり2 DIMM」構成の2つの4ランクRDIMMが1333 MT / sの速度での動作に適していないことを意味します。 メモリ容量とその速度の間で妥協点を選択する必要があります。



「チャネルごとに2つのDIMM」構成の2つの4ランクLRDIMMのデータウィンドウ図を以下に示します。 DRAMの8つの物理グレードの電気的負荷は、メモリバッファの2つの電気的負荷に置き換えられます。 シグナルインテグリティが大幅に向上しました。 条件は前の図と似ていますが、データウィンドウは212 psから520 psに増加し、最大高さは115から327 mVに増加しました。











シグナルインテグリティの向上は、LRDIMMが1333 MT / s以上の速度で動作できることを意味します。チャネルごとに複数のLRDIMMがある場合でも同様です。 容量とメモリ帯域幅を選択する必要はありません。



システムメモリの容量について少し



LRDIMMの主な利点の1つは、メモリパフォーマンスを犠牲にすることなくRAM容量を大幅に増やすことができることです。 DRAMはデータバスから電気的に分離されているため、信号の整合性を維持しながら各DIMMにランクを追加し、各メモリチャネルに追加のDIMMチップを取り付けることができます。 一般的なオプションは32 GB LRDIMMです。 これは、4 GB x 4 GBモジュール、DDP(デュアルダイパッケージ)DRAMです。 各LRDIMMはメモリコントローラーの1つの電気負荷を表すため、チャネルごとにさらに多くのDIMMを設定することもできます。



たとえば、チャネルごとに3つのDIMM、CPUごとに4つのチャネルを持つデュアルプロセッササーバーを考えてみましょう。 LRDIMMを使用すると、RDIMMと比較して、RAM容量を2〜3倍に増やすことができます。 以下は、さまざまな速度と電圧に対するRDIMMとLRDIMMの最大静電容量です。











たとえば、RDIMMのフルセットを備えたシステムで800 MT / sの速度の1.5V DDR3メモリの場合、チャネルごとに16GB 2Rx4 RDIMMを使用する場合のRAM容量は384 GBに達する可能性があります。 LRDIMMを使用すると、この容量を最大768 GBに倍増できます。 マザーボードの制限(通常、チャネルごとに8つのDRAMランク)は、LRDIMMのランクを増やすことで克服されます。 この場合、チャネルごとに12の物理ランクが取得されます。



1066または1333 MT / sの速度では、シグナルインテグリティの制限により、RDIMMを使用した構成ではチャネルごとに3つ以上のDIMMを使用できません。 1066または1333 MT / sの速度の1.5V DDR3メモリの場合、RDIMMの最大RAM容量は256 GBです。 LRDIMMにはそのような制限はなく、チャネルごとに3つのDIMMを1066 MT / s(または1333 MT / s)でセットアップできます。 この場合、合計RAM容量は768 GB、つまり3倍になります。 1333 MT / sの1.35V DDR3Lメモリの場合、LRDIMMの利点はさらに大きくなります。



LRDIMMの消費電力はどうですか?



LRDIMMメモリモジュールを使用すると、北部のメモリ容量を増やすことができるだけでなく、エネルギー効率の低下を最小限に抑えて実行できます。 「チャネルごとに1つのDIMM」構成のLRDIMMのメモリバッファは、同じ構成のRDIMMよりも多く消費しますが、高密度構成(チャネルごとに2および3 DIMM)では、差は平準化されます。



異なるメモリ速度でチャネルごとに1つと2つのDIMMを備えた構成でのRDIMMまたはLRDIMMの正規化された消費電力を以下に示します。 実際の電力消費は密度と使用されるDRAMテクノロジーに依存するため、同じDRAM世代のLRDIMMとRDIMMの相対的な電力が表示されます。 これらは32GB 4Rx4モジュールです。 800 MT / sのRDIMMモジュールの電力は、ユニットごとに使用されます。 測定には、50%の書き込み操作と50%の読み取り操作で標準テストが使用されました。











「チャネルあたり1 DIMM」構成で800 MT / sの場合、LRDIMMはRDIMMよりも17%多く電力を消費しますが、「チャネルあたり2 DIMM」構成では、違いはわずか3%です。 1066 MT / sでこれは15%ですが、「チャネルごとに2つのDIMM」構成では、差もわずかです。 1333 MT / sでは、「チャネルごとに2つのDIMM」構成のLRDIMMでの消費電力は、「チャネルごとに1つのDIMM」構成よりも28%少なくなります。



以下は、100%読み取りの同様の結果です。 LRDIMMは主にメモリ密度の高いシステムで使用されるため、「チャネルごとに2つのDIMM」構成でのLRDIMMの消費がより重要です。 この場合、エネルギー効率の低下はほとんどありません。











ほとんどのIntel E5プラットフォームは、1333 MHzおよび1.5 Vのチャネルごとに2つのLRDIMMと、1066 MHzのチャネルごとに3つのLRDIMMをサポートできます。これにより、プロセッサごとに12のLRDIMMを構成できます。 4ランクRDIMMモジュールを使用する場合、プロセッサごとに8つのソケットのみが関係し、最大速度は800 MHzです。



LRDIMMが必要ですか?



LRDIMMを使用する必要があるかどうかはどうすればわかりますか? サーバーのメモリ転送速度を決定します(パフォーマンスに関するベンダーのドキュメントを参照)。 プロセッサごとに8 x 32 GBを超える場合、LRDIMMモジュールが必要です。それ以外の場合は、周波数が800 MHzで容量が32 GBの4ランクRDIMMモジュールで十分です。 1066 MHzまたは1333 MHzが必要な場合は、LRDIMMのみを使用する必要があります。



異なる世代のIntel Xeon E5 2600シリーズプロセッサをインストールする場合のデュアルプロセッサマザーボードSupermicro X9(LGA2011)およびX10(LGA2011-3)シリーズの例で、メモリ機能のランクと最大周波数の制限を以下に示します。



Supermicro X10シリーズ+ E5-2600 v3(Haswell)



画像






Supermicro X10シリーズデュアルプロセッサカードは、バッファなしメモリモジュール(UDIMM)をサポートしていません。 明らかに、最大のRAM容量とその動作の最大速度を達成するには、LRDIMM DDR4タイプのモジュールが必要です。











Hynix HMTA8GL7AHR4C-PBM2:サーバーのRAM、メモリ容量:64 GB、帯域幅:PC12800、タイプ:DDR3 LRDIMM。


Kingston KVR16LL11​​4 / 32-DDR3Lメモリモジュール、32 GB容量、LRDIMMフォームファクター、240ピン、1600 MHz周波数、ECC、CASレイテンシ(CL)サポート:11.このようなモジュールの平均価格は28,000ルーブルです。







Samsung DDR4 2133 Registered ECC LRDIMM 32Gbメモリモジュール。 平均価格は約22000ルーブルです。 これは、周波数が2133 MHzの288ピンLRDIMMモジュールです。 ECC、CAS Latency(CL)のサポートがあります:15。





Samsung 32GB 288ピンDDR4 SDRAM DDR4 2133(PC4 17000)メモリモジュールサーバーメモリモデルM386A4G40DM0-CPB、Cas Latency 15。



一般に、LRDIMMモジュールでは、標準のRDIMMと比較してRAM帯域幅が最大35%増加します。



LRDIMMの使用は、RAMにロードして大量のデータを処理する必要がある場合、RAM、クラウドコンピューティング、HPC(高性能コンピューティング)タスクを集中的に使用するアプリケーションに最大の効果をもたらします。 仮想環境では、これにより仮想マシンの「密度」を高めることができます。 データセンターで-エネルギー効率を高め、TCO(総所有コスト)を削減します。



代替案? 128GB LRDIMM!



この技術はまだ有効ではなく、サムスンは新しい128 GB LRDIMMメモリモジュールを導入しました。 TSV(Through Silicon Via)と呼ばれるチップのパッケージング技術を使用します。DRAMチップは、3D VNANDの場合と同様に、微細な穴を通過する電極を使用して垂直に接続されます。







128GB RDIM TSV DDR4 DRAMは、真の技​​術的ブレークスルーと見なされます。 その利点は、以前の標準モジュールと比較して2倍の容量、高速性、効率性です。 20nmプロセステクノロジーのおかげで、128GB TSV DDR4メモリは、64GB LRDIMMと比較して消費電力が50%低くなります。 問題の価格を明確にすることは残っています。



実用的なメリット



8つのメモリ位置を持つサーバーの128GBは、それぞれDDR3 RDIMM 16GBb8、つまり9000ルーブル* 8 = 72000ルーブルで組み立てることができます。 LRDIMMでは、これらはそれぞれ30500rの2つの64GBストリップです。つまり、コストは61,000ルーブルになり、従来のソリューションよりも安くなります。 さらに、16個のメモリスロットを備えたマザーボードを過剰に購入することはほとんど意味がありません。サーバーの99%は8スロットボードで組み立てることができます。 これにより、標準のX9DRLに512GBのメモリが残ります。



大容量の64GB DDR4 LRDIMMの価格はそれぞれ75000r(ELKOの64GB PC17000 LR M386A8K40BM1-CPB0Q SAMSUNGメモリモジュール)です。 32GBを入れると、2GBあたりのLRDIMM DDR4の価格は128GBあたり84000Rになります。これは、通常のレジスタメモリよりも少し高価です。

これにより、HOSTKEYで大規模な専用サーバーをより安くリースし、仮想マシンの価格を下げ、プライベートクラスターの信頼性とコストを削減できます。



HOSTKEYについて



2008年以来、専用サーバーと仮想サーバーをリースし、モスクワの4つのデータセンター(2つのTier III認証データセンターを含む)でサーバーホスティングサービスを提供しています。 大規模な専用サーバーに特化し、それらに基づいてクライアント用のプライベートクラウドとクラスターを作成します。



読者向けのホットなオファー: 12月末まで(または終了まで) TMW5U0S8SEプロモーションコードを使用して、T-PlatformスーパーコンピューターとIntel Xeon E5-2630v2プロセッサーをベースにしたサーバーを 15%割引で利用可能



たとえば、比較のために:



-2xE5-2630v2(12x2.6 GHz)/ 64Gb RAM / 1x1Tb SSD + 1x1Tb 7.2K HDD = 17000r /月、14450の割引。

-2xE5-2630v2(12x2.6 GHz)/ 128Gb RAM / 1x2Tb SSD + 1x2Tb 7.2K HDD = 25700r /月、21800の割引あり

-2xE5-2630v2(12x2.6 GHz)/ 256Gb RAM / 2x2Tb Samsung SSD = 36500r /月、31000の割引あり

-2xE5-2630v2(12x2.6 GHz)/ 32Gb RAM / 2x600Gb SAS 10K = 13650r /月、11600rの割引あり



すべての価格には付加価値税が含まれており、ほとんどすべての構成が可能です。



すべてのサーバーはギガビットチャネルで接続され、トラフィック制限は制限なしで10Tbです。 各専用サーバーにはIPMIを介したリモートアクセスが提供され、最大10Gbpsの速度でVLANを編成できます。



All Articles