大規模な移行:RISCでプライベートクラウドを作成した方法

以前の投稿で、私たちはプライベートクラウドについてのを始めました。 大企業では、この規模のプロジェクトはレガシーであり、移行プロセスで予想外の驚きがあります。 今日は、さまざまなシステムを移行した経験を共有し、「DSP」ハゲタカとすべての種類のNDAが点在するインフラストラクチャの一部を紹介します。







x86が私たちに合わなかったより



小さな会社では、管理者はGentooにサーバーをエキゾチックな構成で展開できます。これにより、管理者はより便利に作業できるようになります。 VTBが責任の範囲内にある場合、多数の人々が多数の会議ですべての詳細を評価します。 そうしないと、新しいシステムの展開と運用が大きな問題になる可能性があります。



RISCシステムは銀行セクターで広く普及しており、私たちも例外ではありません。 一部のサービスは、すでにRISCアーキテクチャで実行されているか、RISCアーキテクチャに変換されています。 同時に、私たちの規模のプロジェクトのクラウドプロバイダーは、主にx86で動作します。 すべての長所と短所を評価した後、アーキテクチャを変更せずにすべてのサービスをx86に移行せずに、クラウドが導入される前にRISCで正常に機能したことをRISCに任せることにしました。 さらに、プロジェクト中のx86サービスの一部は、逆にRISCに移されました。



なぜこれを行うことにしたのですか? 移行自体は、許容できないリスクに関連しています。 多くのミッションクリティカルなシステムは、RISCでのみ必要な動作パラメーターに耐えます-ここでは、これらのシステムの安定性が高くなっています。 RISCおよびx86マシンの相応の構成により、ABSおよびOracleデータベースは最初は優れたパフォーマンスを発揮します。 最後に、RISCを使用すると、メンテナンスにかける費用を削減できます。これは、銀行セクターにとっても重要です。 一般に、厳しいセキュリティ部門も法律も、移行のために内部のビジネスに不可欠なサービスでサードパーティを信頼することを許可しません。



プライベートクラウドは、既存のミッションクリティカルなシステムを引き受けることができるだけでなく、RISCベースのシステムと連携するための幅広い機能も備えています。 以前は、上記のタスクのためにテストシステムまたは産業用システムを展開するプロセスには、機器の計画、購入、運用に何ヶ月もかかりました。 これで、マウスを数回クリックするだけで、たとえば、DRシナリオ用に設定されたリソースグループを持つ2つのLPARペアの新しいVeritas Infoscaleクラスターを取得できます。 また、クラウドには、単純な仮想マシンまたは物理サーバーの特定のタスクの割り当てから、必要なテクノロジーを使用したクラスターのデプロイまで、そのような柔軟なテンプレートとスクリプトが多数あります。



もちろん、x86を拒否した人はいませんでした。膨大な数のタスクがまだx86システムで解決されています。 クラウドには、HPテクノロジーと製品に基づく単一のセルフサービスポータルがあり、x86システムとRISCシステムの両方を管理するための単一のエントリポイントです。



VTBとIBM Watsonの共通点は何ですか?



クラウドシステムの中核はIBM P1-80Aサーバーであり、その中心はIBM POWER8プロセッサーです。 IBMは、Watsonスーパーコンピューターでそのようなサーバーを使用しています。 その主な利点は、多数のコアと、Intelハイパースレッディングに類似したSMT8のサポートです。 これらのCPUを搭載したシステムに基づいて、並列負荷で適切に機能するサービスは素晴らしいと感じます。



各サーバーには、クロック周波数4.02 GHzの16個のPOWER8プロセッサー、システムノードごとに4個のプロセッサーがあります。 各プロセッサには12のコアがあり、合計でサーバーあたり192のコアを提供します。 プロセッサリソースを効率的に使用するために、P1-80A物理サーバーはPower Enterprise Poolに統合され、モバイルキャパシティオンデマンド(CoD)ライセンス方式も使用されます。 各サーバーには8テラバイトのRAMがあります。 内蔵ディスクサブシステムは、拡張シェルフの24x387GB SFF SSDで表されます。 仮想パーティションテクノロジー(LPAR)は、アプリケーションの実行と実行に使用され、ライブパーティションモビリティテクノロジーは、物理サーバー間で仮想パーティションを移行するために使用されます。







実装およびサポート契約を締結する際の大きな利点は、機器サプライヤーがロシア出身であることです。 私たちのパートナーはロシア企業のヤドロであり、RISCアーキテクチャに基づいたソリューションを積極的に実装し、国内の暗号化(銀行にとって重要)を扱うために必要なすべてを備えています。 Yadroは、ソリューションに基づいてコンピューティングシステムとストレージシステムを組み立てるために必要な証明書を取得したロシアで最初のIBM OEMパートナーです。



移行



RISCにクラウドシステムを展開するのは簡単な作業ではありませんでした。ロシアでは、このレベルでこれを行った人は誰もいません。 引っ越しのプロセスは2017年の夏に始まり、現在は本格的です。 転送がサービスの作業に影響を与えないように、すべてを慎重に計画しました。 仕事は本格的です:60を超えるさまざまなITシステムが移行の影響を受けます。



すべてに注意深くアプローチします。 テストリラックス環境を積極的に使用しており、x86への移行を再度試みているわけではありません。 移行の過程で、新世代のPOWERプロセッサとOracle DBMSのバージョンに切り替え、外部データストレージとしてFMDとSSDのキャリアを備えたアレイの使用を開始しました。 放棄されたHP UXおよびSPARC。 一般的に、彼らはベンダーの数と機器の種類を減らし、サポート終了のプラットフォームを残しました。







進捗状況



アップグレードと移行の結果に基づいて、多くの重要なシステムに関する統計を収集しました。 そのため、集中型自動銀行システム(CABS)の「ニューアテナ」では、ルーブル支払い注文の完了に必要な時間が短縮されました。 ビジネスプロセスの段階を説明します。





さらに、決済システムのほとんどの手順で、実行速度が2倍に増加しました。 1つのドキュメントの平均処理時間は92ミリ秒から84ミリ秒に減少しました。



最後に、法人および個人にサービスを提供するMbankシステムも顕著な進歩を示しました。ノボシビルスクの支店の1つのトランザクションの処理時間は、エカテリンブルクで464から227ミリ秒に短縮されました-179から130ミリ秒。



耐障害性と結論



クラウドを設計する際、災害耐性(DR)要件が考慮され、クラウドは地理的に分散した2つのサイトに展開されました。 フロントエンドロードのジオバランシングは、BigIP F5プラットフォームを使用して実行されます。 ストレージシステムレベルでの災害復旧は、HDSグローバルアクセスデバイス(GAD)テクノロジーを通じて実装され、3番目のサイトにクラスターアービターがあります。 ホストに発行された各LUNは、必要に応じて両方のサイトに複製され、異なるサイトにあるアレイからの独立したパスを持ちます。



現在、クラウドの導入は本格的です。 この移行の結果、VTBグループのタスクを処理するためのさらに信頼性の高いシステム、責任のあるエンジニアからの余分な白髪、そして目に見える財政的な節約を実現する予定です。 同時に、今日のクラウドはRISCベースのコンピューティングシステムの能力を高め、高負荷で重要なシステムを拡張する機能を追加し、スタンドアロンRISCプラットフォームから新しいサービスへの既存のサービスの移行を容易にします-柔軟でスケーラブル、フォールトトレラント



All Articles