Elastic MapReduceは、膨大な量の多様なデータを簡単に処理できるWebサービスです。 このサービスはEC2とS3の併用、およびHadoopフレームワークに基づいています。
Amazonによると、Elastic MapReduceを使用すると、次のことが簡単にできます。
- Java、Ruby、Perl、Python、PHP、R、またはC ++などの便利な言語で大量のデータを処理するアプリケーションを開発します。
- データと処理アプリケーションをAmazon S3にアップロードします。 信頼性、スケーラビリティ、使いやすさ-それだけです、Amazon S3。
- いわゆるMapReduceの「ジョブフロー」をAWSマネジメントコンソールから開始します。 目的のAmazon EC2インスタンスを選択し、Amazon S3にあるデータとそれらを処理するアプリケーションへのパスを選択し、[ジョブフローの作成]ボタンをクリックするだけで、MapReduceが作業を開始します。
- AWSマネジメントコンソール、コマンドライン、または特別なAPIを介してジョブフローのステータスを監視します。 作業の終了後、結果はAmazon S3に配置されます。
Amazon Elastic MapReduceを使用するには、Amazon欧州データセンターにあるEC2インスタンスではMapReduceがまだサポートされていないため、最初に米国でEC2インスタンスを作成する必要があります。
まあ、もちろん価格。 MapReduceを使用する場合、EC2インスタンス、S3に保存されているデータの量、およびMapReduceテクノロジーの使用に対して支払います。
標準のAmazon EC2インスタンスを使用する場合:
- 小$ 0.015時間
- 大$ 0.06時間
- 特大$ 0.12時間
高CPU EC2インスタンスの場合:
- 中$ 0.03時間
- 特大$ 0.12時間
Amazonは、Hadoopを使用して商用のMapReduceサービスを提供する最初の企業のようです。 そのようなソリューションの有効性について話すには、Elastic MapReduceに基づいたテストと作業プロジェクトを待つ価値があります。
詳細については、 aws.amazon.com / elasticmapreduce