CUDAでの高性能ソート(基数)

GPUがデータをソートできるという本当の証拠(基数アルゴリズム)は、CPUよりも数倍高速です。



バージニア大学シャーロッツビル校のコンピューター工学科のDuane MerrillとAndrew Grimshawは、GTX 480が1秒あたり10億を超える32ビットキーのソート速度を示すSRTS Radix Sortのソートライセンスを無料ライセンスで公開しています。 Core i7プロセッサーの4倍の速度。



この方法は、あらゆるCUDAデバイスに適しています。 現在のバージョンでは、すべての組み込み数値C / C ++データ型(たとえば、signed char、float、unsigned long long)の並べ替えと、すべてのキーが同じ長さの場合の自動最適化をサポートしています(並べ替えの加速は5倍です)。



All Articles