フェヌルオヌバヌクラスタヌの実装の抂芁Stratus、VMware、VMmanager Cloud





サヌビスの䞭断が受け入れられないビゞネスの皮類がありたす。 たずえば、サヌバヌの故障のために課金システムがモバむルオペレヌタヌで停止した堎合、サブスクラむバヌは通信できなくなりたす。 この出来事の起こり埗る結果の認識から、安党であるための合理的な願望が生じたす。



VMmanager Cloudを実装するずきに、サヌバヌ障害に察する保護方法が存圚し、どのアヌキテクチャが䜿甚されおいるかを説明したす 。これは、高可甚性クラスタヌを䜜成するために蚭蚈された補品です 。



たえがき



クラスタのフェヌルオヌバヌ保護の分野では、むンタヌネットの甚語はサむトごずに異なりたす。 混乱を避けるために、この蚘事で䜿甚される甚語ず定矩の抂芁を説明したす。





各ノヌドで仮想マシンが起動される10ノヌドのクラスタヌを展開する必芁があるずしたす。 課題は、ハヌドりェア障害から仮想マシンを保護するこずです。 ラックの蚈算密床を高めるために、デュアルプロセッササヌバヌを䜿甚するこずが決定されたした。



䞀芋したずころ、ビゞネスにずっお最も魅力的なオプションは、障害が発生した堎合にナヌザヌサヌビスが䞭断されない堎合、぀たり、継続的な可甚性のクラスタヌです。 すでに述べた加入者ぞの課金のタスクや、継続的な生産プロセスの自動化では、少なくずもKNDなしでは䞍可胜です。 ただし、このアプロヌチの利点に加えお、萜ずし穎もありたす。 それらに぀いおは、蚘事の次のセクション。



継続的な可甚性



䞭断のない顧客サヌビスは、い぀でもサヌビスが実行されおいるサヌバヌ物理たたは仮想の正確なコピヌがある堎合にのみ可胜です。 機噚の故障埌にコピヌを䜜成するず、時間がかかりたす。぀たり、サヌビスの提䟛が䞭断するこずになりたす。 さらに、故障埌、問題のマシンからRAMの内容を取埗するこずはできたせん。぀たり、そこにある情報は倱われたす。

CAを実装するには、ハヌドりェアず゜フトりェアの2぀の方法がありたす。 それぞれに぀いおもう少し詳しく説明したしょう。



ハヌドりェア方匏は「分岐」サヌバヌです。すべおのコンポヌネントが耇補され、蚈算は同時に独立しお実行されたす。 同期の責任はノヌドであり、特にノヌドは結果を半分ず比范したす。 䞍䞀臎の堎合、原因の怜玢ず゚ラヌの修正が実行されたす。 ゚ラヌが修正されない堎合、障害のあるモゞュヌルは無効になりたす。

Habréで最近、ハヌドりェアCAサヌバヌのテヌマに関する蚘事がありたした 。 資料に蚘茉されおいるメヌカヌは、幎間のダりンタむムが32秒以䞋であるこずを保蚌しおいたす。 したがっお、そのような結果を達成するには、機噚を賌入する必芁がありたす。 ロシアのパヌトナヌStratusは、構成に応じお、同期モゞュヌルごずに2぀のプロセッサを搭茉したCAサヌバヌのコストは玄160,000ドルになるず述べたした。 クラスタごずの合蚈には、1,600,000ドルが必芁です。



゜フトりェアの方法。

執筆時点で、継続的可甚性クラスタヌを展開するための最も䞀般的なツヌルはVMwareのvSphereです。 この補品の継続的可甚性テクノロゞヌは「フォヌルトトレランス」ず呌ばれたす。



ハヌドりェア方匏ずは異なり、このオプションには䜿甚䞊の制限がありたす。 䞻なものをリストしたす。





制限ず非互換性の完党なリストは、公匏ドキュメントにありたす 。

VMware Fault Toleranceテクノロゞヌが仮想マシンを倧幅に「枛速」させるこずが実隓的に確立されおいたす。 vmgu.ruの調査の過皋で、 FTを有効にした埌、デヌタベヌスを操䜜するずきのVMのパフォヌマンスは47䜎䞋したした。



vSphereのラむセンスは物理プロセッサに関連付けられおいたす。 䟡栌は、ラむセンスで1750ドル、幎間サブスクリプションおよびテクニカルサポヌトで550ドルから始たりたす。 たた、クラスタヌ管理を自動化するには、8,000ドルからのVM​​ware vCenter Serverを賌入する必芁がありたす。 2Nスキヌムは継続的な可甚性を確保するために䜿甚されるため、10個のノヌドが仮想マシンで動䜜するには、10個の冗長サヌバヌずそれらのラむセンスを远加賌入する必芁がありたす。 クラスタヌの゜フトりェア郚分の総コストは2 * 10 + 10 * 1750 + 550 + 8000 = 100,000ドルになりたす。



ノヌドの特定の構成を描き始めたわけではありたせん。サヌバヌ内のコンポヌネントの構成は、垞にクラスタヌのタスクに䟝存したす。 たた、ネットワヌク機噚を蚘述するこずは意味がありたせん。すべおの堎合においお、セットは同じです。 そのため、この蚘事では、間違いなく異なるもの、぀たりラむセンスのコストのみを考慮するこずにしたした。



開発が停止した補品に蚀及する䟡倀がありたす。



XenベヌスのRemusは、無料のオヌプン゜ヌス゜リュヌションです。 このプロゞェクトでは、マむクロスナップショット技術を䜿甚しおいたす。 残念ながら、ドキュメントは長い間曎新されおいたせん。 たずえば、2014幎に廃止されたU​​buntu 12.10のむンストヌルに぀いお説明したす。 そしお奇劙なこずに、Googleでさえ、その掻動にRemusを䜿甚しおいる単䞀の䌚瀟を芋぀けられたせんでした。



継続的な可甚性クラスタヌを䜜成する機胜を远加するために、QEMUを改良する詊みが行われたした。 執筆時点では、このようなプロゞェクトが2぀ありたす。



1぀目は、 Kemariで、田村芳明が運営するオヌプン゜ヌス補品です。 QEMUのラむブマむグレヌションのメカニズムを䜿甚するこずになっおいたす。 ただし、最埌のコミットが2011幎2月に行われたずいう事実は、開発が停止し、再開しない可胜性が高いこずを瀺唆しおいたす。



2番目は、同じくオヌプン゜ヌスであるMichael Hinesによっお蚭立されたMicro Checkpointingです。 残念なこずに、1幎間、リポゞトリにアクティビティはありたせんでした。 状況はKemariプロゞェクトに䌌おいるようです。



したがっお、珟圚、KVM仮想化に基づく継続的な可甚性の実装はありたせん。



したがっお、実践により、継続的可甚性システムの利点にもかかわらず、そのような゜リュヌションの実装ず運甚には倚くの困難があるこずが瀺されおいたす。 ただし、フォヌルトトレランスが必芁な堎合もありたすが、サヌビスの継続性に関する厳密な芁件はありたせん。 このような堎合、高可甚性クラスタヌ、KVDを適甚できたす。



高可甚性



HPCのコンテキストでは、機噚の障害を自動的に怜出し、皌働䞭のクラスタヌノヌドでサヌビスを開始するこずにより、フォヌルトトレランスが確保されたす。



CVDでは、ノヌドで実行されおいるプロセスの同期は実行されず、ロヌカルマシンディスクの同期は垞に実行されるずは限りたせん。 したがっお、ノヌドで䜿甚されるメディアは、たずえばネットワヌクデヌタストレヌゞなどの独立した独立したストレヌゞに存圚する必芁がありたす。 理由は明らかです。ノヌドに障害が発生するず、ノヌドずの通信が倱われたす。぀たり、ドラむブ䞊の情報にアクセスする方法がなくなりたす。 圓然、ストレヌゞシステムもフォヌルトトレラントである必芁がありたす。そうでない堎合、定矩によりHPCは倱敗したす。



したがっお、高可甚性クラスタヌは2぀のサブクラスタヌに分割されたす。





珟時点では、ノヌド䞊の仮想マシンでCVDを実装するための次のツヌルがありたす。





VMmanager Cloud補品の機胜を玹介したす。



VMmanager Cloud



圓瀟のVMmanager Cloud゜リュヌションはQEMU-KVM仮想化を䜿甚しおいたす。 このテクノロゞヌは積極的に開発およびサポヌトされおおり、仮想マシンに任意のオペレヌティングシステムをむンストヌルできるため、このテクノロゞヌを遞択したした。 Corosyncは、クラスタヌ内の障害を怜出するためのツヌルずしお䜿甚されたす。 サヌバヌの1぀に障害が発生した堎合、VMmanagerは、そのサヌバヌで実行されおいる仮想マシンを残りのノヌドに順番に分散したす。



簡略化された圢匏では、アルゎリズムは次のずおりです。



  1. 仮想マシンの数が最も少ないクラスタヌノヌドが怜玢されたす。
  2. リストに珟圚のVMを配眮するのに十分な空きRAMがあるかどうかが芁求されたす。
  3. 分散マシンに十分なメモリがある堎合、VMmanagerはこのノヌドに仮想マシンを䜜成するコマンドを発行したす。
  4. 十分なメモリがない堎合、より倚くの仮想マシンを搭茉するサヌバヌで怜玢が実行されたす。


倚くのハヌドりェア構成でテストし、既存のVMmanager Cloudナヌザヌにむンタビュヌし、埗られたデヌタに基づいお、機噚の速床に応じお、障害が発生したノヌドからすべおのVMを配垃および再開するのに45〜90秒かかったず結論付けたした。



実践では、緊急事態には1぀たたは耇数のノヌドを割り圓お、通垞の運甚䞭にVMを展開しない方がよいこずが瀺されおいたす。 このアプロヌチにより、クラスタ内の「ラむブ」ノヌドに、「デッド」仮想マシンを持぀すべおの仮想マシンをホストするのに十分なリ゜ヌスがない堎合の状況がなくなりたす。 1台のバックアップサヌバヌの堎合、バックアップスキヌムは「N + 1」ず呌ばれたす。



VMmanager Cloudは、ファむルシステム、LVM、ネットワヌクLVM、iSCSI、およびCephのストレヌゞタむプをサポヌトしおいたす。 HPCのコンテキストでは、最埌の3぀が䜿甚されたす。



氞久ラむセンスを䜿甚する堎合、10個の「戊闘」ノヌドず1぀のバックアップのクラスタヌの゜フトりェア郚分のコストは、3,520ナヌロたたは3,865ドルになりたすラむセンスは、プロセッサ数に関係なく、ノヌドあたり320ナヌロかかりたす。 このラむセンスには1幎間の無料アップデヌトが含たれおおり、2幎目以降はクラスタヌ党䜓で幎間880ナヌロ盞圓のアップデヌトパッケヌゞの䞀郚ずしお提䟛されたす。



VMmanager Cloudナヌザヌが高可甚性クラスタヌを実装したスキヌムを芋おみたしょう。



Firstbyte



FirstByteは、2016幎2月にクラりドホスティングの提䟛を開始したした。 最初は、クラスタヌはOpenStackを実行しおいたした。 ただし、このシステムに利甚可胜な専門家が䞍足しおいるため可甚性ず䟡栌の䞡面で、別の゜リュヌションの怜玢が必芁になりたした。 高圧燃料ポンプを制埡するための新しい機噚には、次の芁件が課されたした。



  1. KVMで仮想マシンを提䟛する機胜。
  2. Cephずの統合の存圚;
  3. 利甚可胜なサヌビスの提䟛に適した課金ずの統合の可甚性。
  4. 手頃な䟡栌のラむセンス。
  5. 補造元のサポヌトの可甚性。


その結果、VMmanager Cloudは芁件に最も適しおいたした。



クラスタヌの特城的な機胜





䞀般的に、システムは次のようになりたす。





この構成は、トラフィックの倚いサむトをホストする堎合、ゲヌムサヌバヌやデヌタベヌスを䞭から高負荷でホストする堎合に適しおいたす。



Firstvds



FirstVDS䌚瀟は、フォヌルトトレラントホスティングサヌビスを提䟛しおいたす;この補品は2015幎9月に発売されたした。



同瀟は、次の理由でVMmanager Cloudを䜿甚するようになりたした。



  1. ISPsystem補品の䜿甚経隓が豊富。
  2. デフォルトでBILLmanagerず統合。
  3. 優れた品質のテクニカルサポヌト補品。
  4. Cephサポヌト。


クラスタヌには次の機胜がありたす。





䞀般的なスキヌムは次のようになりたす。





Infinibandネットワヌクに䞀般的な障害が発生した堎合、VMディスクストレヌゞずコンピュヌティングサヌバヌ間の接続は、ゞュニパヌの機噚に展開されおいるむヌサネットネットワヌクを介しお実行されたす。 「ピックアップ」は自動的に行われたす。



ストレヌゞずの盞互䜜甚が高速であるため、このようなクラスタヌは、トラフィックが非垞に倚いサむトのホスティング、ストリヌミングコンテンツの再生を䌎うビデオホスティング、および倧量のデヌタの操䜜の実行に適しおいたす。



゚ピロヌグ



蚘事を芁玄したす。 サヌビスのダりンタむムの1秒ごずに重倧な損倱が発生する堎合、継続的な可甚性のクラスタヌなしではできたせん。



ただし、仮想マシンがバックアップノヌドに展開されおいる間、5分間埅぀こずができる堎合は、CVDに目を向けるこずができたす。 これにより、ラむセンスず機噚のコストを節玄できたす。



さらに、フォヌルトトレランスを向䞊させる唯䞀の方法は冗長性であるこずを思い出すしかありたせん。 サヌバヌをバックアップしたら、デヌタ回線ず機噚、むンタヌネットアクセスチャネル、および電源を予玄するこずを忘れないでください。 予玄できるすべお-予玄。 このような察策により、システム党䜓が機胜しなくなる誀動䜜に起因する、単䞀の障害点である薄いスポットがなくなりたす。 䞊蚘のすべおの察策を講じた埌、フェヌルオヌバヌクラスタヌを受け取るこずになりたすが、これを無効にするのは非垞に困難です。



高可甚性スキヌムがタスクにより適しおいるず刀断し、その実装甚のツヌルずしおVMmanager Cloudを遞択するず、システムの詳现を理解するのに圹立぀むンストヌル手順ずドキュメントが芋぀かりたす 。 スムヌズな操䜜をお願いしたす



PS組織にハヌドりェアCAサヌバヌがある堎合は、コメントを蚘入しおください。 私たちは、このような機噚の䜿甚が経枈的に実珟可胜なプロゞェクトに぀いお聞いおみたいず思っおいたす。



All Articles