インテル®Parallel Studio XE 2016ベータ版-新機能

今週、インテル®Parallel Studio XEの大きなアップデートがリリースされました。 バージョン2016には、3つの新しい製品が含まれています。

  1. インテル®データ分析アクセラレーションライブラリ(インテル®DAAL) -C ++およびJavaデータ分析ソリューション(統計、機械学習など)。
  2. インテル®Advisor XE 2016ベータの一部としての新しいベクトル化アドバイザー 。SIMD命令のコードを最適化します。 ベクトル化。
  3. MPIプログラムのパフォーマンスの全体的な評価をすばやく行うためのMPIパフォーマンススナップショット


ベータ版は一般公開されており、無料でプログラムは6月23日まで有効ですが、ライセンスは2015年9月25日まで有効です。ベータ版を入手するには、 ここで登録する必要があります

この記事は、新しい機能のレビューに専念します。個々の製品については、後続のブログで詳しく説明します。興味のあることについてのコメントを書いてください。



インテル®Advisor XE 2016ベータ



インテル®Advisor XEは、伝統的にスレッドのプロトタイプ同時実行プロトタイプです。 バージョン2016ベータ版では、実際には2つの大きな製品に分割されています。





ベクトル化アドバイザーの主な機能:







ベクトル化アドバイザーについては、次のブログで詳しく説明します。



Intel®Data Analytics Acceleration Library(Intel®DAAL)2016 Beta



さまざまな段階で「ビッグデータ」を操作するための最適化されたライブラリ:ソースからのデータの受信、前処理、変換、データマイニング、モデリング、検証、意思決定。







コンパイラ



正式名称は、Intel®Parallel Studio XE 2016 Beta、Composer Editionです。 この製品は、コンパイラとライブラリを組み合わせています。 インテル®コンパイラーは、サポートされている一連の標準を拡張します。



OpenMP * 4.0:



OpenMP * 4.1 TR 3:



C / C ++標準:



Fortranコンパイラは、サブモジュールのサポート、初期化されていない変数の実行時チェックの改善(オプション[Q]init



)、IMPURE ELEMENTALのサポートの追加(F2008)、Cの相互運用性の改善(F2015)を開始しました。



インテル®VTune™Amplifier XE 2016ベータ版



VTune™Amplifier XEの新しいバージョンは、OpenMPおよびMPIアプリケーションのプロファイル機能を拡張しました。 OpenMPの場合、このツールは並列領域に関する統計を提供し、最適化の可能性が最も高い領域を強調表示します。 VTune Amplifierは、OpenMPの非効率性の主な原因(負荷の不均衡、オーバーヘッド、同期など)を認識します。OpenMP分析の詳細はすでに記述されています



VTune Amplifierは、MPIアプリケーションのプロファイル機能を大幅に拡張しました。最も興味深いのは、ハイブリッド、MPI + OpenMPです。 つまり OpenMPとMPI通信の不均衡を同時に分析できます。



ボトムアップテーブルでは、MPIプロセスとその中のOpenMPリージョン、およびリージョン内の個々のバリア(ループなど)ごとにグループ化できます。



インテル®HDグラフィックスで実行されているOpenCLプログラムのパフォーマンスの分析は、GPUハードウェアブロックとその負荷(コンピューティングコアとデータトラフィックの忙しさ)を明確に見ることができる新しい「アーキテクチャ図」によりさらに便利になります。



VTune Amplifier XEに対するその他の変更:





インテル®MPIライブラリー5.1ベータ





新しい-gtool



オプションを使用-gtool



と、MPIアプリケーションのアナライザーツールを便利に実行でき-gtool



。 たとえば、ベクトル化分析のためのベクトル化アドバイザー:



mpirun -n 4 -gtool "advixe-cl -collect survey:2,3" ./your_app







または、個々のランクのパフォーマンスを分析するVTuneアンプ:



mpirun -n 4 -gtool "amplxe-cl -collect hostpots:2,3" ./your_app







この例では、分析は4つのランクのうちランク2および3でのみ実行されることに注意してください。 つまり 個々のプロセスを選択的にプロファイルできます。



Intel®Trace Analyzer and Collector 9.1ベータ版



主な革新はMPIパフォーマンススナップショットです。 このツールは、トップレベルのパフォーマンス評価を迅速に行うために使用されます。アプリケーションのスケーリング方法、MPI、OpenMP、およびコンピューティング負荷のバランス。



ハイブリッドアプリケーション分析の改善:インテル®トレースアナライザーでは、インテル®MPIライブラリの新しい<code-gtoolオプションを使用して、MPIランクを選択し、VTune™Amplifierコマンドラインを生成できます。 つまり まず、インテル®トレースアナライザーで問題のあるMPIプロセスを特定し、次にVTune™アンプで詳細に調査します。





まとめ



インテル®Parallel Studio 2016ベータ版は、さまざまな方法で一連の重要な新機能を提供します。



これの一部は、HPC開発者向けの従来のセットの開発ですが、多くはマルチメディアやデータ分析などの他の分野に拡大しています。



これは簡単な概要でしたが、次の投稿でさらに詳しく説明します-そもそも何が面白いのか教えてください。

Intel®Parallel Studio XE 2016 Betaに登録します。



All Articles