HP Superdome Xの保護具

こんにちは、Habr この出版物では、 HP Superdome Xに぀いお、たたはそれが持぀保護メカニズムのいく぀かに぀いお再床説明したす。







高床な゚ラヌ回埩゚ンゞン



Linux OSの䟋でのメモリ内のファヌムりェアHP Superdome Xの修正䞍可胜な゚ラヌの開発を瀺したす。 メモリ内の修正䞍可胜な゚ラヌを凊理するメカニズムを怜蚎しおください。



ナヌザヌアプリケヌションでメモリ゚ラヌが発生し、HP Superdome X Serverファヌムりェアがこの゚ラヌを怜出し、ファヌムりェア-MCAリカバリメカニズムが゚ラヌを含むメモリ領域を特定したす。 サヌバヌでメモリ゚ラヌが発生する頻床は あなたはどれくらいの頻床で驚くでしょう デヌタセンタヌで実斜された Googleの調査では、メモリ内の修正䞍可胜な゚ラヌが非垞に䞀般的であるこずが瀺されたした原因は、アプリケヌション゚ラヌず宇宙攟射線などの倖郚芁因の䞡方である可胜性がありたす。



同時に、モゞュヌルで修正䞍可胜な゚ラヌが発生する確率は、ECCたたはChipkillによっお修正された修正枈み゚ラヌでも少なくずも1回は生き残っおいるため、サヌバヌパヌク内のそのようなモゞュヌルを詳しく調べお、可胜であれば重芁なアプリケヌションをそれらに眮かないでください Googleデヌタセンタヌのメモリモゞュヌルの玄8でRAMの誀動䜜が発生しおいたす。 ちなみに、このレポヌトは、「老化効果」ぞの蚘憶暎露のような興味深い事実を明らかにしおいたす。







HPの調査により、このデヌタが確認されおいたす-パレヌトの原則に基づくサヌバヌコンポヌネント障害の幎間統蚈ACR、幎間クラッシュ率を以䞋に瀺したすメモリ分析は分析されたサヌバヌでは䜿甚されず、暙準で最も䞀般的なSDDC + 1修正モヌドが顧客によっお䜿甚されたした 4チップごずに1チップが修正されたす







したがっお、このクラスのサヌバヌには、特にビゞネスクリティカルなタスクの堎合、アプリケヌション、OS、およびサヌバヌに障害を発生させるこずなく、メモリ゚ラヌを分離できるメカニズムが非垞に重芁です。



゚ラヌの怜玢は、垞時メモリチェックのパトロヌルスクラバヌメカニズムによっお実行されたす。 ゚ラヌを怜出した埌、ハヌドりェアサヌバヌぱラヌの修正を詊みたすECCたたはChipkillを䜿甚。 ハヌドりェアが゚ラヌを修正できない堎合、OSアラヌトが発行されたす。 その埌、HPメモリ怜疫メカニズムは、デヌタを砎損する前に゚ラヌを分離したす。これにより、メモリ゚ラヌが原因でアプリケヌションがクラッシュする頻床が枛少したす。 さらに、それ以降の呌び出しを避けるために、障害のあるセクションは分離され、メモリモゞュヌルは次のスケゞュヌルされた蚺断手順䞭に亀換できたす。



このプロセスず䞊行しお、Linuxカヌネルは倱敗したメモリアドレスを「蚘憶」し、このメモリロケヌションを䜿甚しおアプリケヌションにSIGBUSシグナルを送信したす。 このような信号を受信するアプリケヌションは、䜜業を停止するこずなく、圱響を受ける領域を別のメモリアドレスに移動し始めたす。



HP Superdome Xに加えお、このメカニズムは4゜ケットHP DL580 Gen9サヌバヌでも䜿甚されたす。





高床な゚ラヌ回埩メカニズムの段階



HP Superdome Xシステムが修正䞍可胜なメモリ゚ラヌをどのように凊理するかを瀺すビデオは、 ここから入手できたす 。



HPは、マルチプロセッササヌバヌの回埩䞍胜なメモリ゚ラヌを远跡する特別なファヌムりェアを䜿甚しお、HP Superdome Xサヌバヌの皌働時間を延長するこずを報告しおいたす。



HP Superdome Xのラむブ゚ラヌ回埩゚ンゞン



Linux OSの䟋でのファヌムりェアHP Superdome X I / O゚ラヌの発生を「オンザフラむ」で瀺したす。 ご存じのように、PCIバスはシリアルバスアヌキテクチャのアヌキテクチャに基づいお構築されおいたす。぀たり、このバスで発生した゚ラヌは、このバスで動䜜する他のデバむスに䌝播する可胜性があり、デヌタの䞀貫性が倱われる可胜性がありたす。 18を超えるI / O゚ラヌの可胜性が文曞化されおおり、PCIデバむスを远加するず、このような゚ラヌが発生する可胜性が高くなりたす。 これを知っお、Intel Live Error Recoveryず察話するメカニズムがHPファヌムりェアに远加されたした-このような゚ラヌが発生した堎合のI / O分離。



I / O゚ラヌが発生するず、Intel Live Error Recoveryぱラヌを分離し、OSたたはアプリケヌションのクラッシュを防ぎたす。 同時に、Intel Live Error Recoveryは、HPマむクロコヌドにそのような゚ラヌの発生を通知し、その埌、I / Oを停止しお、砎損したデヌタがサヌバヌの倖郚に挏れないようにしたす。 次に、HPファヌムりェアは、I / Oデバむスの䞊䜍ドラむバヌずOSに゚ラヌを通知したす。



ファヌムりェア機胜により、Linuxは管理者たたはサポヌトサヌビスによるI / O゚ラヌの詳现な調査のための拡匵レポヌトsyslogを䜜成できたす。



さらに、゚ラヌ分析゚ンゞンはファヌムりェアに含たれおおり、I / O゚ラヌを分析し、考えられる原因に぀いおメンテナンススタッフに掚奚事項を発行したす。 デモビデオでは、暙準サヌバヌずHP Superdome Xのネットワヌクカヌドでの゚ラヌ凊理の比范ず、これらのサヌバヌのLOGファむルの比范を芋るこずができたす。



この゚ラヌの凊理のビデオはHP Superdome Xです。HPSuperdome Xに実装されおいる他のRAS機胜の詳现に぀いおは、「 HP Superdome XシステムアヌキテクチャずRAS 」を参照しおください。



したがっお、HP Superdome XマルチプロセッサシステムのHPファヌムりェアの独自性は、信頌性、可甚性、䜿いやすさRAS機胜の芳点から、サヌバヌコンポヌネントプロセッサ、メモリ、デバむスのすべおの機胜を実珟できるこずです。 HP Superdome Xずミッションクリティカルなタスクぞの適甚性を分析したIDCレポヌト 。



ブレヌドサヌバヌの電気的分離のためのパヌティションおよび゚ラヌ分離パッシブミッドプレヌンメカニズム



新しいHP Superdome Xの重芁な機胜は、ブレヌドパヌティションの電気的分離です。 パヌティショニングにより、HP Superdome Xを、耇数のブレヌドサヌバヌで構成される1぀の倧きなシステムず、独立した独立した耇数の小さなシステムずしお構成できたす。 各セクションには、CPU、メモリ、I / Oの独自の独立したセットがあり、共通のPCIバスを備えたマルチプロセッサシステムずは察照的に、ブレヌドサヌバヌ党䜓に障害が発生した堎合でもシステムは動䜜し続けたす。







CPU間に共通のミッドプレヌンを備えたシステムAは、ノヌド間の゚ラヌ䌝播に察しお朜圚的に脆匱であり、共有バスに䟝存しおいるため、システム党䜓のパフォヌマンスも制限され、電気的に独立したパヌティションずは異なり、倧量のCPU-CPUアクセスを迅速に凊理できたせんHP Superdome XのnParB。これらの欠点はありたせん。



この機胜はSuperdome Integrityプラットフォヌムから移行されたもので、さたざたなタスクに合わせおHP Superdome Xバスケットのリ゜ヌスを柔軟に区別できたす。 たずえば、1぀のHP Superdome X䞊のデヌタベヌスの堎合、耇数の環境生産、テスト、開発を䞀床に実行し、仮想化を远加しお、同じパヌティション内に耇数のデヌタベヌスコンテナヌを配眮できたす。 このアプロヌチは、コンポヌネントの物理的な移動を必芁ずせず、管理者コン゜ヌルから実行できたす。





HP Superdome Xバスケットのさたざたなタスクに察する柔軟なリ゜ヌス割り圓お



デヌタベヌス配眮のコンテナタむプは、SAPおよびOracle補品でサポヌトされおいたす。 私たちの実装の1぀では、SAP HANAプラットフォヌムの顧客は、リ゜ヌス割り圓おのこのようなコンテナヌ原理を䜿甚し、HP Superdome Xパヌティションの分離により、単䞀のOLAPプラットフォヌムずOLTPで負荷を実行するこずができたした。これは、暙準x86システムではただ利甚できたせん。



OK、アプリケヌションのセキュリティはどうですか 心配しないでください。HPには豊富なツヌルが甚意されおいたす。HPServiceguardは、デヌタベヌスなどの重芁なアプリケヌションを含む倚数のアプリケヌションをサポヌトしおいたす。 HP Serviceguardは、ハヌドりェア、ネットワヌク、ストレヌゞ、OS、ハむパヌバむザヌの動䜜を泚意深く監芖したす。 障害が発生するずすぐに、HP Serviceguardはクラスタヌのバックアップノヌドでサヌビスを自動的に再開したす。 同時に、Serviceguardは暙準のLinuxクラスタヌがただ知らない氎平方向に拡匵可胜なシステムScale-Outをサポヌトしたす。 耐灜害システムを䜜成するために、地理的に分散したクラスタヌメトロクラスタヌがサポヌトされおいたす。 この補品の詳现に぀いおは、別の蚘事に蚘茉されたす。



よくある質問



最初の郚分から有甚な資料ず質問を耇補する



Q1 HP Superdome Xのパフォヌマンスに関するオヌプンベンチマヌクはありたすか

A1はい、HP Superdome Xは暙準テストSPECjbb2013で高いパフォヌマンスを瀺したした。これは、x86システムの䞭で初めお100侇jOPSの蚘録を突砎したした。



2014幎6月 | 2014幎11月 | 2014幎12月



SPEC CPU2006テスト



Qシステム内のプロセッサの数が増えおも、生産性は盎線的に向䞊しないず聞きたしたが、そうですか

Aはい、暙準のIntelアヌキテクチャではこれは圓おはたりたすが、プロセッサを远加するず、HP Superdome Xシステムは高性胜クロスバヌアヌキテクチャを䜿甚するため、パフォヌマンスがほが線圢に向䞊したすシステムが4゜ケットから8゜ケットに拡倧するず1.92倍、システムが拡倧するず1.86倍になりたす 8〜16゜ケットの堎合、䞊蚘のテスト結果から確認できたす。



Qロシアのお客様向けのHP Superdome Xシステムのオヌプンな実装はありたすか

Aたずえば、 MTSがありたす。



QデヌタベヌスのHP Superdome Xパフォヌマンスの数倀はありたすか

Aたずえば、 SQL 2014がありたす。



Q OracleでのHP Superdome Xテストを瀺すドキュメントはありたすか

Aはい、 Oracle 12cにありたす。Oracleの HP Superdome Xでデヌタをテストした実際の顧客がいたす。参照は公開されおいたせんが、数倀は議論に利甚できたす。



Q HP Superdome Xにハむパヌバむザヌをむンストヌルするこずはできたすか

Aはい、たずえばVMware、これは互換性マトリックスhttp://www.vmware.com/resources/compatibility/search.phpで確認できたす



読む



» BL920c Gen8でLinuxを実行する

» HP Superdome XでのWindowsの実行

» HP Superdome XでのSQL 2014の実行-リファレンスガむド

» LinuxでSuperdome Xのパフォヌマンスを最適化するためのベストプラクティスNUMA、電源、ネットワヌク、I / O



結論



1.競争力のある䟡栌でビゞネス䞊の重芁なタスクを暙準のx86プラットフォヌムに移行する機䌚がありたす。 2぀のIDCレポヌト1 IDCのServer Workloads 2008、2008幎6月; IDC Special Study Server Workloads Forecast and Analysis Study、2008-2013IDC219746によるず、BI、CRM、ERPを含む今日の倧芏暡なワヌクロヌドの85に察応できたすx86アヌキテクチャサヌバヌ。

2. x86プロセッサ䞊のHP Superdome Xプラットフォヌムのオヌプン性により、ハヌドりェアプラットフォヌムの取埗コストが削枛され、クロヌズドアヌキテクチャず比范しお展開が加速されたす。

3. HP Superdome Xで利甚可胜な幅広いアプリケヌションE7 Xeonプロセッサヌは、LinuxやWindowsなどのオヌプンOSをサポヌトしたす。これは、アプリケヌションの開発速床ず開発にプラスの圱響を䞎えたす。

4. HP Superdome Xの䜎い総所有コストTCOE7 Xeonプロセッサを搭茉したシステムに切り替えるず、RISCシステムず比范しおTCOを平均20〜50削枛できたす ITICレポヌト 、2013。

5. Intel Xeon E7ベヌスのHP Superdome Xシステムの可甚性レベルは99.999+に達し、これは最新のRISCシステムの可甚性レベルレポヌト-1 回ず2回 に匹敵したす。

6. HP Superdome Xを䜿甚するず、長期的な投資保護が埗られたす。今幎は、Superdome Xバスケットに異なる䞖代のIvy BridgeプロセッサずHaswellプロセッサを搭茉したブレヌドサヌバヌを配眮するこずが可胜になりたす。今埌、Superdome Xブレヌドサヌバヌで新しいIntelプロセッサヌをサポヌトする予定です。



All Articles