
Apache Hadoopライブラリは、大規模なデータセットの分散処理を実行します。 このために、Hadoopの単純なプログラミングモデルが使用されます。 Hadoopの主な目的は、複数のサーバー上のデータ処理プロセスとそれらの同期の制御を提供することですが、ソフトウェアを犠牲にしてのみ、クラスター、ハードウェアレベルで制御を削除します。
Hadoop用のIBM PureDataシステムは、クラウドアーキテクチャ用に準備されたハードウェアとソフトウェアの観点から、これを念頭に置いて設計されました。 Hadoopのすべての利点と機能は、PureDataが提供できるサポートとシンプルな管理と組み合わされています。

統合され、生産性を高めるために最適化された高可用性環境を構築する必要がある場合、Hadoopの無料配布バージョンでは多くの問題に直面します。 Hadoop用のPureDataシステムにはすでにこの機能がすべて備わっています。また、すでに使用している他のPureSystemsハードウェアソリューションと完全に統合されています。 これらは、有料ソリューションと無料ソリューションのどちらを選択するかを検討する際の重要なポイントです。 複雑なオープンソースツールが使用され、必要な機能を実現するために独自の追加ソフトウェアを作成するための膨大なスキルを必要とする実装例が多数ありました。 その結果、開発者が他のプロジェクトまたは他の企業に切り替えたときに、問題が発生しました。 PureData for Hadoopのような商用オファーは高価な選択肢のように思えるかもしれませんが、長期的にはアップグレード、サポート、既存システムとの統合にかかる時間と費用を節約できます。
出典: PureSystemsブログ