今日の企業では、情報は原則としていくつかの方法といくつかのプラットフォームで構築され、保存されています。 データは構造化されておらず、最適化されていない形式で存在するため、戦略的に重要な意思決定に必要な情報を抽出することはできません。 このシナリオでのビッグデータの役割は、さまざまな入力データからそのような情報を収集し、構造化し、分析、意思決定、および予測分析での作業に使用するデータを提供する機能です。 最新のIBM PureSystemsは、このような課題に基づいて、ビッグデータの概念とApache Hadoopソリューションを組み合わせています。
Apache Hadoopライブラリは、大規模なデータセットの分散処理を実行します。 このために、Hadoopの単純なプログラミングモデルが使用されます。 Hadoopの主な目的は、複数のサーバー上のデータ処理プロセスとそれらの同期の制御を提供することですが、ソフトウェアを犠牲にしてのみ、クラスター、ハードウェアレベルで制御を削除します。
Hadoop用のIBM PureDataシステムは、クラウドアーキテクチャ用に準備されたハードウェアとソフトウェアの観点から、これを念頭に置いて設計されました。 Hadoopのすべての利点と機能は、PureDataが提供できるサポートとシンプルな管理と組み合わされています。
Hadoopとこのシステムの統合を確実にするために、 IBM InfoSphere BigInsightsとIBM System xサーバーが結合されました。 したがって、大きなデータセットを処理するためのソフトウェアは、管理の観点からは単純な複合体に統合され、IBMはコンピューティング複合体全体に対して更新を行います。 サードパーティのHadoopハードウェアおよびソフトウェアサポートサービスに連絡する必要はありません。
統合され、生産性を高めるために最適化された高可用性環境を構築する必要がある場合、Hadoopの無料配布バージョンでは多くの問題に直面します。 Hadoop用のPureDataシステムにはすでにこの機能がすべて備わっています。また、すでに使用している他のPureSystemsハードウェアソリューションと完全に統合されています。 これらは、有料ソリューションと無料ソリューションのどちらを選択するかを検討する際の重要なポイントです。 複雑なオープンソースツールが使用され、必要な機能を実現するために独自の追加ソフトウェアを作成するための膨大なスキルを必要とする実装例が多数ありました。 その結果、開発者が他のプロジェクトまたは他の企業に切り替えたときに、問題が発生しました。 PureData for Hadoopのような商用オファーは高価な選択肢のように思えるかもしれませんが、長期的にはアップグレード、サポート、既存システムとの統合にかかる時間と費用を節約できます。
出典: PureSystemsブログ