ScaleIOテストエクスペリエンス

この出版物では、EMC ScaleIO 1.32.2に基づいて分散ストレージをテストした経験を共有したいと思います。



「国内サーバーからのデータを格納するフォールトトレラントシステムを作成する方法」「古いサーバーを急いで捨てないでください。1時間で高速イーサネットストレージを組み立てることができ ます」という記事を読んで試してみることにしました



最初に、2番目の記事の1つの写真に疑問を投げかけます。 ドキュメントによると、クラスターは2つのノードのみで構成でき、3つがそこに表示されます(青色)。







EMCからの応答がなかったために発生した問題を議論するために書かれました。 はい、システムはテストベンチに展開されました。ライセンス条件の下でのメーカーからの技術サポートはありません。 しかし、World Wide Webでの検索では、望ましい結果が得られませんでした。



実際には、テストベンチの特性





最初の誤解は、最初のノードにMeta Data Managerをインストールした後に発生しました。 構成するには、OSを再起動する必要がありました。インストールプロセスの完了直後に--add_primary_mdmコマンドを実行しようとすると、必要なポートがすべてLISTENING状態であり、必要なすべてのサービスが開始されていたにもかかわらず、接続エラーが永続的に表示されたためです。



次に、2番目のノードを接続してクラスターを構成し、 データサーバーの役割をインストールするプロセスが問題なく通過しました。



データサーバーノードで、iSCSIとローカルディスク上の1つの大きなファイルを介して接続されたディスク上のRAWパーティションの形式で、2つのストレージデバイスが正常に接続されました。



iSCSIを介してディスクを接続することの特性は、これらのディスクのソースが、予期せずオン/オフをオン/オフするネットワーク上のコンピューターであり、宣言されたフォールトトレラントテクノロジー( RebuildRebalance)を完全にテストするのに役立ちました 2週間にわたるシステムの観察中、作業のこれらの側面に関する苦情はありませんでした。 すべてがバタンとうまくいきました。



問題は、各Data Serverノードで接続されているデバイスの数を増やしようとしたときに始まりました。 --add_sds_deviceコマンドまたはGUIを介して新しいデバイスが接続されなかった理由を見つけることができませんでした。 すべての操作が「通信エラー」エラーで終了しました。 そして各ノードに対して。 同時に、接続された各デバイスはブロックデバイスとしてOSで使用でき、フォーマット、ファイルオブジェクトの作成、SMBプロトコル経由の操作に抵抗しません。



ただし、最も重大なエラーは数週間後に発生しました。



ある日、クラスターが劣化状態にあることに気付きました。 夜には電気に問題があり、ネットワークは部分的に機能しませんでした。 両方のData Managerノードがセカンダリステータスでした。 同時に、 タイブレーカーノードは両方のノードからネットワーク経由でアクセスできました。



プライマリのノードの強制変換は不可能であり、管理ポートはリッスンしていないため、クラスター設定をファイルにアップロードすることはできません。



つまり、 Data Serverのすべてのノード、 Data Clientが動作し、ネットワークレベルで相互に情報を交換し、クライアントに提供されたディスクパーティションが使用可能であり、情報の整合性が壊れていません。



ただし、状況はデッドロックです。構成を変更したり、新しいノードを追加したりすることはできません。



新しいプライマリデータマネージャーを作成して、新しいクラスターを作成し、既存のセカンダリノードをそれに接続しようとしました。 幻の希望は生まれずに死にました-新しいクラスターはきれいでした(原則として、最初から理解できました)。



もう1つの小さな欠点は、GUIのサイズをモニターの現在の解像度のサイズに調整できないことです。GUIの寸法は固定され、少なくとも1280x1024の解像度用に設計されています。



Googleとのコミュニケーションに多くの時間を費やしましたが、適切なものは見つかりませんでした。



EMCのWebサイトにアクセスすることにしました。オンラインコンサルタントウィンドウがあります。 テクニカルサポートからの連絡を求め、特定された問題を説明する手紙を彼に書きました。



(ロシア語の)返信の手紙で、彼らは私に質問を明確にするように頼んだ。 私は彼らに答え、しばらくしてから答えると約束しました。 一週間以内に返事を待たずに、手紙で自分のことを思い出しましたが、今のところ見返りはありません。



私の調査結果



記事の冒頭にある2番目のリンクで記事に記載されているテストの結果は、
フェールオーバーテストが正常に完了しました


私はこれに同意できません。 これは、私がテストした最初のソフトウェア定義の分散ストレージです。 徐々に他の人をテストします。 結果に応じて、登録を解除します。



All Articles