高可用性アプリケーションの代替技術

RISCプラットフォーム機器に基づいて高可用性構成を構築する場合、非常に限られたクラスターソフトウェアのセットから選択します。 まず第一に、これらはベンダーの開発-Oracle Solaris Cluster、PowerHA(IBM)、Serviceguard(HP)、およびVeritas Cluster Serverです。 実際、後者の決定は、クラスタ構成を構築するため、および異なるプラットフォーム(Oracle、IBMなど)のために現在提案されている主なオプションです。



ただし、これらの開発のみに限定せず、x86の代替クラスターソリューションを探すことにしました。 そのため、Pacemakerソフトウェアに基づいてクラスター構成をテストする内部プロジェクトが開始されました。



Pacemakerは、多くのLinuxディストリビューションの一部であるオープンソース製品です。 この製品は、広範なクラスタートポロジ、さまざまなクォーラム戦略、開始順序の決定、アプリケーション間の依存関係、並列アプリケーションなどをサポートしています。 彼にはライセンスプログラムがないため、ライセンスを購入する必要はありませんが、同時に、Red Hatなどの多くのベンダーがソリューションをサポートできます。



このプロジェクトの主な目標は、当社が提供する高可用性構成のクラスタリングと構築のための製品と技術の範囲を改善および拡大し、既存のソリューションのより手頃な代替を作成することでした。



次のタスクを設定します。





構成をテストする際の成功の主な基準を特定しました。 1つ目は、構成がサービスの高可用性を保証する基本機能の実装を提供する必要があることです。 サーバー(ハードウェア、OS)の障害、ディスクリソースへの接続障害、LAN接続障害、アプリケーションサービス障害など、ハードウェアとソフトウェアの主な障害に対して保護を提供する必要があります。 機能のパフォーマンスのチェックは、PMIに従って実行されました。



2番目の基準は、Veritas Cluster Serverと比較して、テスト対象の製品が商業的に実行可能であることです。



3つ目は、便利なGUI、監視および通知ツールなどの追加の製品機能の存在です。



テストベンチを準備しました。その一般的なスキームを図に示します。 1。



1.テストベンチのレイアウト











構成の整合性を確保するために、各クラスターノードには、クラスター間相互作用ネットワークで2つの接続があります。 さらに、クラスターノードの可用性を高めるために、各ノードは、アプリケーションデータを転送するように設計されたネットワークのパブリックセグメントへの重複した接続を持っています。



クラスタ構成は、Oracle 11g2 DBMSのインスタンス用に構築されました。 システムをバックアップするために、1 + 1スキームが使用されました。 これは、同じタイプの機器の使用と、障害が発生した場合にバックアップノードにサーバーの機能を転送する機能を意味します。 ソリューションの概略図を図に示します。 2。



2.決定スキーム









コンピューティングノード間のクラスターリソースの分布を図に示します。 3。



3.計算ノード間のクラスターリソースの分散の構成











oracle-grpグループには、次のリソースが含まれます。





グループ外のリソース:





この決定により、いくつかの制限が特定されました。 テストの時点で、Pacemakerソフトウェアに基づいたフォールトトレラント構成を作成するためにサポートされているOracle DBMSのバージョンは、Oracle Database 10gおよび11gでした。 前述のように、テストはOracle Database 11g2で実行されました。 Oracle Database 12cはサポートされていません。



調製された溶液は、完全な試験サイクルにかけられました。 主なものとテスト結果を表に示します。 1。



タブ。 1.テストサイクルとその結果

番号p / p





確認する要件





試験結果









Pacemaker ソフトウェアに基づくクラスター検証方法論





1。

ハードウェアとソフトウェアの構成と構成の確認





完了





2。

パブリックネットワークのネットワーク接続予約を確認する





完了





3。

SAN予約チェック





完了





4。

DBMSの可用性チェック





完了





5。

クラスター管理コンソールに接続します





完了





6。

クラスターリソースステータスの確認





完了





7。

クラスターノードの状態の確認





完了





8。

クラスター構成を確認する





完了





9。

ハートビートを確認する





完了





10。

IOフェンシングステータスの確認





完了





11。

サービスの可用性の確認(メインクラスターノードのカーネルパニック)





完了





12。

サービスの可用性の確認(メインクラスターノードのすべてのイーサネット接続の無効化)





完了





13。

サービスの可用性の確認(メインクラスターノードのすべてのFC接続の無効化)





完了





14。

サービスの可用性の確認(クラスターソフトウェアによって制御される強制終了プロセス)





完了





15。

サービスの可用性の確認(メインクラスターノードのILOを使用してリセット)





完了





16。

フォールトトレランスメカニズムの動作の確認(1つのクラスター間相互作用ネットワークからのメインクラスターノードの切断)





完了





17。

フォールトトレランスメカニズムの動作の確認(すべてのクラスタ間ネットワークからメインクラスタノードを切断する)





完了





18。

バックアップノードへのサービスの定期的な移行





完了







結論



Pacemakerの高可用性構成ソフトウェアは、フォールトトレランスの基本的な要件を満たしており、生産性の高いアプリケーションでVCSの代わりになる可能性がありますが、次の制限がいくつかあります。





ソリューションの開発の主な方向とベンダーの計画:





構成をスケーリングする機能:ドキュメントによると、Pacemaker(最大16ノード)に基づいてマルチノードクラスターを構築できます。



DR構成を作成する機能:Pacemakerソフトウェアに基づいた本格的なDRソリューションを構築することはできません。 サポートされるソリューションは、DRBDレプリケーションを使用した「ストレッチされた」クラスター構成です。 ストレージメーカーのレプリケーションメカニズムとのネイティブな統合はありません。



Pacemakerソフトウェアの主な特徴は次のとおりです。





同時に、テストしたソリューションの多くの欠点が明らかになりました。





クラスターソリューションの経験から、Veritas Cluster Serverクラスターソフトウェアを使用する方が、専門知識、システムの信頼性と安定性、構成の柔軟性と機能、ベンダーサポートの観点からより望ましいことがわかります。 この指標によると、PacemakerはVeritasよりも劣っています。



それでも、価格が決定的な要因である場合、上記のニュアンスと制限を考慮してPacemakerソフトウェアを使用することができます。



この記事は、Jet Infosystemsのコンピューティングシステムの設計エンジニアであるAnton Goloshchapovによって作成されました。



All Articles