
数年前から、このような機会は、EMC Isilonに基づく階層型ストレージの作成として利用可能です。 これは、特定のストレージプール(均一性または密度に基づいて結合されたノードのシステム)にデータを送信できることを意味します。 その結果、データストレージの効率はコストの面で劇的に向上します。
S210高速ノードから構築されたすべての新しいデータをPool-1に保存するポリシーを作成できます。

応答時間は非常に短くなりますが、コストは高くなります(より高速なドライブ、プロセッサなど)。 次に、「30日以上アクセスされていないすべてのデータをプール2に移動する」などの第2レベルのポリシーを作成できます。 この複合システムは、プール1と比較して、大容量(36 SATAディスク)で応答時間が長いX410ノードから構築できます。 要求の少ないデータでさえ、非常に高いストレージ密度を持つHD400ノードから構築されたPool-3に既に移動できます-59U SATAディスク+ 4Uモジュールごとに1つのSSDこのレベルは、非常にまれにしか要求されないデータのみを対象としており、ユーザーに大きな影響を与えることはありません。
ポリシーベースのデータ移動は、OneFSエンジンを使用してバックグラウンドで実行されます。 この場合、ファイルの論理的な場所は変更されません。 つまり、1つのフォルダーを作成できます。そのフォルダー内のファイルは3つの異なるリポジトリーにあります。
プールとストレージ層
同じデータがライフサイクルのさまざまな段階(生データ、生、処理済み、複製、バックアップ、アーカイブ)を通過する可能性があります。 各段階には、データのアクセシビリティと安全性に関する独自の要件があります。 異なる種類の情報が一緒に保存される他の多くのストレージシステムとは異なり、Isilonは異なるストレージレベル(Tier)を使用します。 各レベルでは、データの分離、処理、保存に特定のポリシーが使用されます。 このようなアプローチにより、ライフサイクルのさまざまな段階で情報を保存するコストを削減し、情報をより速く処理し、より効率的に管理できます。 これらのタスクはストレージ層を使用して実行され、ストレージ層はさらに高度に特殊化されたプールに分割できます。

すべてのプール/ストレージ層用の単一のファイルシステム。
現在、いくつかのタイプのプールがあります。
- S-高速、トランザクション計算用に設計されています。
- X-高速、ストリーミングタスク用に設計されています。
- NL-「ウォーム」アーカイブを作成するために設計された低速。
- HD-低速で、「コールド」アーカイブを作成するように設計されています。
5番目のビューも表示されました-クラウド(外部または内部)。
既に述べたように、各プールは同じタイプのノードから形成されます(実際、それらはわずかに異なる場合がありますが、これはすでに投稿の範囲外です)。 非常に大きなクラスターを展開している場合は、異なるストレージレベルに分割することをお勧めします。 各レベルには1つ以上のプールが含まれます。 しかし、場合によっては、そのような分割は不要です。 ポリシーがプールやストレージ層の存在を暗示していない可能性があります。
政治家
ストレージ階層化ポリシーは、WebUI、CLI、またはAPIを使用して簡単に構成できます。 さらに、ポリシーを作成する際の基準として、ファイルへのアクセス頻度だけでなく、ファイルの種類、場所、所有者、またはその他の属性も使用できます。 ユーザーインターフェイスには、使用可能な定義済みのテンプレートが既にあります。 たとえば、アーカイブテンプレートには、古いデータを対応するストレージに移動するルールが含まれています。 また、ExtraProtectテンプレートは、特定の属性値(たとえば、n + 2ではなくn + 3)を使用して、より高いレベルのファイル保護を設定するのに役立ちます。 同時に、WebUI自体の使用は非常に簡単で、直感的です。


CloudPools-OneFS 8.0のイノベーション
OneFS 8.0に登場した興味深い革新の1つは、新しいタイプのプール-クラウドでした。 現在、サポートするオブジェクトAPIを使用しています。
- Amazon s3
- Microsoft Azure
- EMC Elastic Cloud Storage
- EMC Isilon
最後の2つの製品は、多数のオブジェクトREST APIのサポートのおかげで、プライベートクラウドアーカイブの作成に使用できます。 おそらく、GoogleやVirtustreamなど、他のクラウドストレージプロバイダーのサポートの導入が期待できます。

CloudPoolsを使用すると、単一のファイルシステムを使用してクラウドストレージを操作できます。
クラウドストレージセキュリティ
クラウドに移動する必要があるファイルの要件を設定するポリシーを設定するとします。 たとえば、移動する必要があります:
- 5 MBを超えるファイル-> AND
- / ifs / data / stefanにあるファイル-> AND
- 3か月以上要求されていないファイル。
ポリシーは、Smartpoolsタスクスケジュールに従って適用されます。 OneFSの他のすべてのタスクと同様に、計画と実行の制御はジョブエンジンによって実行されます。 タスクには優先度と実行時間を割り当てることができ、現在の状況に応じて、タスクを一時停止できます。

Smartpoolsが開始されると(たとえば毎日22:00)、現在のポリシーですべてのフォルダーとファイルをチェックし、指定された基準を満たすものをクラウドに移動します。
ローカルファイルシステムは、3種類の情報を含むスタブファイルを保存します。
- ファイルのメタデータ(作成時刻、最終アクセス時刻、サイズなど)
- クラウド内のデータへの「リンク」。
- 元のキャッシュデータの一部。
既に述べたように、ユーザーまたはアプリケーションの観点からは、「通常の」ファイルとスタブファイルに違いはありません。 もちろん、必要に応じて計算することもできますが、これについては別の機会に説明します。
クラウドプールとローカルキャッシュからファイルを呼び出す
スタブファイルにアクセスすると、対応するコンテンツがクラウドから取得され、SSDまたはHDDにローカルにキャッシュされます。 ただし、このデータはファイルシステムに永久に保存されるわけではありません 。 そうしないと、ストレージ容量がローカルファイルシステムの数倍になる可能性があるため、コマンドを表示するだけで、すべてのユーザーがローカルファイルシステム全体を詰まらせる可能性があります。 したがって、適切な特権を持つ管理者またはユーザーのみが、一部のデータに永続的なキャッシュ属性を割り当てることができます。 キャッシュ自体の動作は、CloudPools設定を使用して制御できます。 たとえば、クラスターに次のことを指示できます。
- ローカルに呼び出されるデータをキャッシュするかキャッシュしないか。
- キャッシュの先読みメカニズムは、アクセスが許可されているデータ、または完全なファイルに対してのみ使用されます。
- 特定の時間(数秒から数年)キャッシュにデータを保存しました。
- 一定の頻度で、キャッシュへの書き込みを遅らせました(つまり、クラスターがローカルキャッシュで変更されたクラウドデータに書き込む頻度)。
賞味期限
賞味期限は、スタブファイルが削除された後、アーカイブデータがクラウドに保存される期間です。 このパラメーターは、ポリシーごとに個別に構成できます。 デフォルトでは、保持期間は1週間です。その後、対応するデータは削除されます。 さらに、以下を構成できます。
- 増分NDMPバックアップおよびSyncIQの有効期限。 このパラメーターは、SyncIQを使用して他のストレージと同期した後、または増分NDMPタスクの一部としてバックアップを実行した後、クラウドにデータを保存する期間を決定します。 デフォルトでは、この場合の保存期間は5年です。 つまり、ローカルスタブファイルを削除した後、NDMPまたはSyncIQを使用して復元できますが、データは指定された期間利用可能になります。
- NDMPの完全バックアップの保存期間。 すべてが前のケースと同じですが、NDMPの完全バックアップのみが対象です。
おわりに
CloudPoolsは、水平方向に拡張可能なIsilon NASシステムから透過的な外部階層ストレージを作成するための便利なツールです。 現在、2つのサードパーティクラウドサービスと2つの外部システム(Isilon、ECS)がサポートされています。 サポートされるサービスとシステムのリストは大幅に拡張されるでしょう。 クライアントの観点から見ると、データの移動は透過的であり、AES-256を使用した暗号化によりセキュリティが確保されています。 言い換えれば、CloudPoolsを使用すると、スケーラブルなマルチプロトコルシステムを短い応答時間で実装でき、その成長制限は事実上無制限です。
この出版物の範囲外では、いくつかの重要な問題が残っています。 たとえば、パフォーマンス:バックアップとレプリケーション中にスタブファイルはどうなりますか? 災害復旧、異なるサイトからのCloudPoolsのデータへのアクセス、CloudPoolsシステムの段階的な作成についてはどうですか? これについては、次の出版物のいずれかに記載します。