CUDAでの高速JPEG圧瞮

抂芁 NVIDIAグラフィックカヌドでJPEG画像を圧瞮するための高速FVJPEG゚ンコヌダヌを䜜成したした。 アルゎリズム、その実装、およびCUDAテクノロゞヌを䜿甚した最適化を䞊列化するこずにより、倧幅な加速が埗られたした。 圧瞮速床の芳点では、FVJPEG゚ンコヌダヌは、ベヌスラむンJPEGアルゎリズムを䜿甚した画像圧瞮甚の既存のすべおの゜フトりェアおよびハヌドりェア゜リュヌションよりも優れおいたす。



非可逆画像圧瞮アルゎリズムを比范する堎合、圧瞮の皋床ず結果の画像の品質はほが垞に議論されたすが、圧瞮時間は䜕らかの理由で二次的な指暙ず芋なされたす。 どうやら、ほずんどのアプリケヌションでこのアプロヌチは有効ですが、圧瞮時間が非垞に重芁になる堎合がありたす。 たずえば、画像の倧きな配列を圧瞮するずき、たたはリアルタむム圧瞮を必芁ずする倧量のデヌタを生成できる機噚を䜿甚するずき。 これは、高速カメラからの䞀連の画像を圧瞮するずきの状況です。 䞀般的な高速カメラからのデヌタストリヌムは、毎秒625 MB解像床1280 x 1024、8ビット、毎秒500フレヌム以䞊に達する可胜性がありたす。 PCI-Express 2.0 x8フレヌムグラバヌを介しお2.4 GB /秒の速床でコンピュヌタヌのRAMにオンラむンでデヌタを曞き蟌む高速ビデオカメラがありたす。 このようなフロヌを凊理するために、デヌタ凊理アルゎリズムを䞊列化する芁件を怜蚎する必芁さえありたせん。これは定矩によるものです。 したがっお、高速圧瞮アルゎリズムを遞択するために、次の基準が策定されたした。





JPEGアルゎリズムはこれらの芁件に完党に準拠しおいたす。 これらの条件を満たす他の非可逆圧瞮アルゎリズムがある可胜性がありたすが、ここではJPEGオプションのみを怜蚎したす。



最初に、ベヌスラむンJPEGアルゎリズムを䜿甚した非可逆画像圧瞮の速床パフォヌマンスのベンチマヌクを調べたす。ただし、画像が既にRAMにロヌドされおおり、圧瞮のみが必芁な堎合がありたす。 埗られた゜リュヌションず明らかに匱い競合他瀟ずを比范する堎合、広範な方法には埓いたせん。したがっお、ラむバルずしお、今日のマルチコアCPU向けの最速の商甚゜リュヌションを怜蚎したす。



Accusoft Pegasus PICTools Photo JPEG゚ンコヌダヌ  毎秒150-250 MBのパフォヌマンス、8ビット、圧瞮率〜50の圧瞮



Intel JPEG゚ンコヌダヌIPP-7.0 uic_transcoder_con.exe、バヌゞョン7.0ビルド205.85、[7.7.1058.205]、名前ippjy8-7.0.dll +、2011幎11月27日、64ビット、公匏の圧瞮率デヌタなし、テスト結果以䞋に瀺す



高速ビデオカメラを䜿甚するためのNorpix JPEG゚ンコヌダヌ 毎秒200〜250 MBのパフォヌマンス、8ビット、䞍明な圧瞮率の圧瞮



残念ながら、゚ンコヌド時間を報告するIPP-7゚ンコヌダヌを陀いお、このデヌタを怜蚌する方法はありたせん。 より詳现な分析を行うには、凊理アルゎリズムの各段階のパフォヌマンスに関するデヌタもありたせん。そのため、同じ圧瞮パラメヌタヌを持぀䞀般的なパフォヌマンスむンゞケヌタヌのみに比范を制限する必芁がありたす。 KakaduはJPEGコヌデックを芋぀けるこずができたせんでした。この䌚瀟は珟圚、JPEG2000コヌデックのみをリリヌスしおおり、libjpeg_simd-6bおよびlibjpeg-turboの圧瞮速床が非垞に䜎かったためです。



固定量子化テヌブルずハフマンテヌブルを䜿甚したベヌスラむンJPEG暙準の実装に぀いお話しおいるため、圧瞮画像の品質ず圧瞮率は圧瞮パラメヌタヌによっお䞀意に決定されるため、PSNR枬定ず芖芚的な品質評䟡は䞍芁です。 ただし、すべおのテストでPSNR枬定ず芖芚品質評䟡が実行されたした。



マルチコアCPUでの最高の商甚゜リュヌションの結果は印象的であるため、それらを䞊回るこずを詊みるこずは非垞に興味深いです。 これを行うには、NVIDIA CUDAテクノロゞを䜿甚したベヌスラむンJPEGアルゎリズムを䜿甚しお、ビデオカヌド䞊の画像を圧瞮するオプションを怜蚎しおください。 タスクは最倧のパフォヌマンスを埗るこずであるため、ハヌドりェアは適切でなければなりたせん。 NVIDIA GeForce GTX 580はぎったりです。



この研究分野では、゚ントロピヌコヌディングの段階のためにJPEGアルゎリズムを完党に䞊列化できないず述べおいる倚くのプロゞェクトず科孊論文が発芋されおいたす。 したがっお、離散コサむン倉換がビデオカヌドで実行され、残りの蚈算がCPUで実行されたずきに、ハむブリッド゜リュヌションが海倖で䜜成されたした。 したがっお、1぀のステヌゞのみが加速され、明らかにGPUに適しおいたす。 その結果、コヌディング速床はわずかに向䞊したしたが、CPU䞊の最高のマルチスレッド゜リュヌションず圧瞮率を競うこずはできたせんでした。 残念ながら、NVIDIAたたはATIビデオカヌドに基づく生産的なJPEG゚ンコヌダヌに関する情報を芋぀けるこずができたせんでした。



元の非圧瞮画像デヌタがコンピュヌタヌのRAMにあり、JPEGで圧瞮する必芁がある問題を考えおください。 ビデオカヌドでのベヌスラむンJPEGアルゎリズムの実装には、次の段階が含たれたす。



  • RAMからビデオカヌドぞのデヌタのダりンロヌドホストからデバむスぞの転送
  • RGB-> YCbCr倉換8ビット画像には䞍芁
  • 画像を8x8ブロックに分割する
  • 各ピクセルのオフセット128を枛算
  • 各ブロックの離散コサむン倉換DCT
  • 各ブロックの量子化
  • 各ブロックの再配眮ゞグザグ
  • 各ブロックからのDCのデルタコヌディングDPCM
  • 各ナニットからのACの盎列゚ンコヌドRLE
  • 各ブロックからのACのハフマンコヌディング
  • ブロックグルヌプのRSTn再起動マヌカヌの蚭定
  • 出力ファむルの生成圧瞮ブロックからのデヌタの接着、JFIFヘッダヌの远加
  • ビデオカヌドからRAMぞのJPEGファむルのアンロヌドデバむスからホストぞの転送


このスキヌム党䜓がCUDAに実装されたした。 暙準JPEGアルゎリズムの䞻なアむデアの1぀は、画像を8x8ブロックに分割し、離散コサむン倉換を䜿甚する独立したデヌタ凊理を行うこずです。これは、本質的に䞊列アルゎリズム回路です。 離散コサむン倉換の䞊列化はすでに知られおおり、パフォヌマンスの芳点から埗られた結果は、CPUよりもGPUの方がはるかに優れおいたした。 DC係数のデルタコヌディングステヌゞDPCMも䞊列化できたす。 シリヌズコヌディングRLEずハフマンコヌディングは、各8x8ブロックのデヌタに察しお独立しお実行されるため、これらも䞊列です。 結論ずしお、各ブロックから出力ファむルに圧瞮デヌタを曞き蟌み、そこからJPEG画像を圢成し、ファむルをコンピュヌタヌのRAMに送信する必芁がありたす。 したがっお、ほがすべおのJPEG゚ンコヌディングスキヌムが正垞に䞊列化され、このアルゎリズムはGPUで完党に実装できるず䞻匵できたす。



デコヌドの実装に関する問題は残っおいたす。 このため、マヌカヌは圓初、JPEG暙準で提䟛されおいたため、圧瞮むメヌゞ内の任意の堎所からだけでなく、連続しおデコヌドするこずができたす。 残念ながら、CPUのほずんどの実装では、JPEG圧瞮アルゎリズムにはこれらのマヌカヌがありたせん。したがっお、そのような状況では、デコヌドの第1段階が順次実行され、「゚むリアン」画像は比范的ゆっくりデコヌドされたす゚ンコヌド時にこれらのマヌカヌが眮かれたす。 ゚ンコヌド時にマヌカヌを蚭定した堎合、デコヌドを開始する前に、むンストヌルされおいるすべおのマヌカヌのクむック怜玢が行われ、その埌、䞊行しおデコヌドを実行するこずが可胜になりたす。 䞊蚘の圧瞮方匏では、特定の数の8x8ブロックの埌にマヌカヌがむンストヌルされたす。その結果、デコヌドプロセスも䞊列になりたす。 ただし、デコヌドの問題はこの蚘事の範囲倖です。



プログラムをテストするために、次の暙準条件が遞択されたした。

  • 8ビットのテスト画像
  • 圧瞮率50-100
  • 氎平および垂盎の画像サむズは8の倍数でなければなりたせん
  • ゜ヌスファむルのサむズは64 MB以䞋


テストでは、次のコンピュヌタヌ構成を䜿甚したした。

  • ASUS P6T Deluxe V2 LGA1366、X58、ATX Core i7 920、2.67 GHz、DDR-III 6 GB
  • 蚈算甚のビデオカヌドGeForce GT 240cc = 1.2、96コアたたはGeForce GTX 580cc = 2.0、512コア。
  • オペレヌティングシステムWindows-7、64ビット、CUDA 4.1、ドラむバヌ286.19


テスト8ビット画像は䞀般的に受け入れられlenna.bmp、boats.bmp、IPPuic_test_image.bmpから䜿甚され、cathedral.bmpずbig_building.bmpはここで取埗されたす



各画像の衚の䞀番䞋の行は、量子化テヌブルずハフマンテヌブルでの圧瞮時の圧瞮率ず圧瞮率ファむルサむズが枛少する回数の察応を瀺しおいたす。これらは、ベヌスラむンJPEGでデフォルトで受け入れられたす。

テスト画像



Windowsでの合蚈FVJPEGコヌデックランタむムは、QueryPerformanceCounter関数を䜿甚しお枬定されたした。 ビデオカヌド䞊の個々の機胜の実行時間は、NVIDIAプロファむラヌを䜿甚しお枬定されたした。 プロファむラヌの結果は、アルゎリズムの各段階の圧瞮速床を詳现に分析するために必芁です。これは䞻に開発者にずっお興味深いものです。 同じデヌタで蚈算を繰り返すこずは実甚的ではないため、すべおのテストでの繰り返し数枬定時間の粟床を高める倚くのプログラムのオプションは1に等しくなりたす。 したがっお、䞻なタスクは、゚ンコヌダの実際の動䜜モヌドず圧瞮パフォヌマンスの制限倀を調べるこずでした。 小さい画像の堎合、コヌディング速床が10〜20広がるため、䞀連のテストで最高の結果が埗られたした。 テストには、NVIDIA GeForce GT 240およびGeForce GTX 580グラフィックスカヌドのFVJPEG゚ンコヌダヌず、Core i7 920のIPP-7.0のJPEG゚ンコヌダヌが含たれたす。



è¡š2は、圧瞮率に応じおさたざたな8ビット画像のNVIDIA GeForce GT 240ビデオカヌドのJPEG圧瞮率の枬定結果をメガバむト/秒で瀺しおいたす。

NVIDIA GeForce GT 240グラフィックスカヌドの圧瞮速床



è¡š3は、NVIDIA GeForce GTX 580グラフィックスカヌドのJPEGでの圧瞮速床をメガバむト/秒で枬定した結果を瀺しおいたす。

NVIDIA GeForce GTX 580グラフィックスカヌドの圧瞮速床



圧瞮速床を枬定するずき、ビデオカヌドにデヌタをコピヌする時間、およびその逆の時間を考慮するこずが非垞に重芁です。 実際、GPUでJPEGの圧瞮アルゎリズムを実装する堎合、ビデオカヌドのメモリにデヌタをコピヌするのにかかる時間は、通垞最も長い操䜜の1぀です。 ビデオカヌドのメモリぞのデヌタのロヌドを考慮せずにコヌディングパフォヌマンスを評䟡する堎合、぀たり 損倱のある画像を圧瞮するずきの蚈算のパフォヌマンスを枬定したい堎合、十分に倧きい画像ず50の圧瞮率で、GeForce GTX 580のJPEGで1秒あたり10 GB以䞊の圧瞮速床が埗られたす。この結果は、䞊列蚈算の最高の効率の優れた䟋です匷力なグラフィックカヌド。



Intel IPP-7.0アップデヌト6の゚ンコヌダヌず比范するために、NVIDIAビデオカヌドのテストず同じ画像セットず同じ圧瞮率が䜿甚されたした。 コマンドラむンは次のようになりたした。uic_transcoder_con.exe-otest.jpg -ilenna.bmp -t1 -q50 -n8。これは、むメヌゞlenna.bmpの圧瞮、新しいむメヌゞtest.jpgの䜜成、ベヌスラむンJPEGアルゎリズム-jbの䜿甚、時間の枬定を意味したす粟床を高めたプログラム実行-t1、8スレッドに䞊列化した堎合の圧瞮率50-q50-n8。 同じむメヌゞを再圧瞮する実甚的なタスクがないため、-m動䜜モヌドは圧瞮手順を繰り返すために䜿甚されたせんでした。



è¡š4は、IPP-7.0からのJPEG゚ンコヌダヌのパフォヌマンスの結果を瀺しおいたす1秒あたりのMb圧瞮率/ミリ秒単䜍の画像圧瞮時間。

IPP-7.0からCPU Core i7 920たでのJPEG゚ンコヌダヌ圧瞮率



IPP-7.0のテストむメヌゞを䜿甚し、同じ圧瞮パラメヌタヌuic_test_image.bmp、1280 x 960、8ビット、圧瞮率は508.1倍の圧瞮に盞圓を䜿甚するず、GeForce GTX 580で2.25のパフォヌマンスが埗られたすGB /秒。IPP-7.0からJPEG゚ンコヌダヌ甚の8スレッドを䞊列化する堎合、Core i7 920 CPUでの332 MB /秒よりも著しく優れおいたす6.7倍高速。 IPP-7.0゚ンコヌダヌの結果ずしおのパフォヌマンスは、同じパラメヌタヌで毎秒680 MBの圧瞮速床を提䟛する、かなり匱いGeForce GT 240グラフィックスカヌドず比范しおも2倍䜎いです。



図1は、さたざたな倀のGeForce GT 240、GeForce GTX 580FVJPEG゚ンコヌダヌ、およびCPU Core i7 920IPP-7.0のJPEG゚ンコヌダヌでのテスト画像cathedral.bmp2000 x 3008、8ビットの圧瞮率の結果を瀺しおいたすベヌスラむンJPEG圧瞮率

GeForce GT 240、GeForce GTX 580、およびCPU Core i7 920でのJPEGのCompression.bmp 8ビット画像圧瞮率



NVIDIAプロファむラヌを䜿甚しお、゚ンコヌドアルゎリズムの各段階の期間を枬定したした。 è¡š5は、ベヌスラむンJPEGアルゎリズムずデフォルトの量子化テヌブルおよびハフマンテヌブルを䜿甚した圧瞮時間のベンチマヌクを、NVIDIA GeForce GTX 580グラフィックスカヌドのさたざたな圧瞮率に察しお瀺しおいたす。画像cathedral.bmp、解像床2000 x 3008、8ビット、床の埌の括匧内圧瞮は、このむメヌゞが圧瞮される回数を瀺したす。

GeForce GTX 580グラフィックスカヌドでのJPEG圧瞮のメむンステヌゞのランタむム



したがっお、ビデオカヌドでJPEG圧瞮アルゎリズムの各段階を実行する速床を確認できたす。゜ヌスデヌタの読み蟌み、離散コサむン倉換、シリヌズコヌディング、ハフマンコヌディング、圧瞮画像のアップロヌドです。 ゚ントロピヌコヌディングのレヌトを評䟡する堎合、シリヌズのコヌディングずハフマンによるコヌディングの寄䞎を区別する必芁がありたす。 実際、JPEGアルゎリズムのさたざたな段階でデヌタサむズが異なるため、パフォヌマンスを蚈算する際に重芁です。 ハフマンコヌディングの堎合、コヌディング速床の掚定倀を䜎くするために、圧瞮ファむルのサむズをランタむムで陀算できたす。 圧瞮の各段階の速床の正確な倀を蚈算するには、時間だけでなく、蚈算の各段階で゜ヌスデヌタのサむズも枬定する必芁がありたす。



したがっお、JPEGアルゎリズムを䜿甚したビデオカヌド䞊の画像の非垞に高速な圧瞮の基本的な可胜性が瀺されおいたす。たた、予算ずモバむルカヌドを含むかなり広いクラスのNVIDIAグラフィックカヌドに察しおも可胜です。 さらに、結果は、マルチコアCPUの最速の゜リュヌションで芋たJPEG゚ンコヌド速床のベンチマヌクよりも倧幅に優れおいたす。



ビデオカヌドのJPEGアルゎリズムの各段階の実行時間を分析するず、次の図が埗られたす。最も遅い操䜜の1぀は、コンピュヌタヌのRAMからビデオカヌドにデヌタをロヌドするこずです。 倧きな画像の堎合、ダりンロヌドずアップロヌドの䞡方の速床は玄6 GB /秒です。 この制限は、PCI-Express 2.0バスの垯域幅によるものであり、原則ずしお倧幅な高速化は、次䞖代のPCI-ExpressGen2からGen3に移行する堎合にのみ可胜です。 画像の読み蟌み時間ず離散コサむン倉換の実行時間は、画像サむズのみに䟝存したす。 シリヌズコヌディングずハフマンコヌディングは、画像自䜓の特定のデヌタ、圧瞮率、およびこの圧瞮段階でのデヌタのサむズに䟝存したす。



生産性を高めるための重芁なポむントは、画像サむズです。 画像サむズが倧きいほど、ビデオカヌドの圧瞮率は高くなりたす。 どうやら、これは、小さな画像のデヌタがビデオカヌドを完党にロヌドするには䞍十分であり、コンピュヌティングパワヌの䞀郚がアむドル状態になっおいるためです。 比范的倧きなフレヌム4メガバむト以䞊を䜿甚するず、ビデオカヌドの党負荷ず圧瞮パフォヌマンスが向䞊したす。 それでも、小さな画像には加速オプションがありたす。耇数のフレヌムを䞀床にロヌドしお、それらを䞊行しお゚ンコヌドできたす。 したがっお、ビデオカヌドを完党にダりンロヌドし、小さな画像でも最倧のパフォヌマンスを埗るこずができたす。 したがっお、䞀連の小さなフレヌムの圧瞮率は、倧きな単䞀の画像で埗られる結果に近くなりたす。 耇数の画像を同時にダりンロヌドおよび圧瞮するこの動䜜モヌドはすでにテストされおおり、FVJPEGコヌデックの最終バヌゞョンに含たれたす。



たた、損倱の倚いJPEG画像圧瞮速床に぀いおGeForce GTX 580グラフィックスカヌドで埗られた結果は、同じアルゎリズムのすべおの既知のハヌドりェアFPGA画像圧瞮゜リュヌションよりもパフォヌマンスが優れおいるこずに泚意しおください。 以䞋の䌁業は、いく぀かの最速のJPEG FPGA画像圧瞮システムを提䟛しおいたす。



Barco BA116 JPEG゚ンコヌダヌ高速ベヌスラむンDCTベヌスのJPEGカラヌ゚ンコヌダヌ-FPGA甚のJPEGハヌドりェア゚ンコヌド機胜、最倧140 MB / sのパフォヌマンス。



キャスト株匏䌚瀟 JPEG-CベヌスラむンJPEG圧瞮コヌデックコア -FPGA甚ゞヌプのハヌドりェア圧瞮機胜、Xilinx Virtex-6では最倧275 MB / s、アルテラFPGA Stratix IVでは最倧280 MB / s。



VisengiJPEG / MJPEGハヌドりェアコンプレッサヌIPコア -Virtex-5 FPGA甚のjeepegハヌドりェア゚ンコヌディング機胜、最倧405 MB / sのパフォヌマンス。



Alma-TechSVE-JPEG-E、SpeedView察応JPEG゚ンコヌダヌメガファンクション -アルテラ/ザむリンクスFPGAのベヌスラむンJPEGハヌドりェア圧瞮機胜、最倧500 MB /秒のパフォヌマンス。



専門的な展瀺䌚では、最倧680 MB /秒の容量を持぀FPGA甚のJPEG゚ンコヌダヌの䜜成に関する民間䌁業からの報告がありたした4぀の個別のナニットが䞊行しお動䜜し、それぞれ170 MB /秒を提䟛したすが、そのような゜リュヌションの詳现は芋぀かりたせんでした。



GPU䞊の゜フトりェア゚ンコヌダヌずFPGA䞊のハヌドりェアJPEG゚ンコヌダヌを比范するず、Verilog / VHDLず比范しお、GPU䞊で結果ずしお埗られる゜リュヌションのパフォヌマンスが高いこずに加えお、CUDAのCコヌドがより理解しやすく、倉曎に基づいお新しいものを䜜成するこずに泚意する䟡倀がありたす、より耇雑な画像凊理および圧瞮システム。 FPGAには利点があるこずは明らかですが、蚈算速床の問題のみを考慮するこずに限定したす。



完党を期すために、ビデオカヌドの䞊列コンピュヌティングテクノロゞの既存の欠点を忘れおはなりたせん。 たず、ビデオカヌドでの蚈算は、䞊列化されたアルゎリズムに察しおのみ意味がありたす。これは、倚くのシヌケンシャルアルゎリズムではこれが䞍可胜なこずを意味したす。したがっお、実装にはCPUの゜フトりェアが必ず必芁になりたす。 たた、CUDAテクノロゞヌはNVIDIAが補造したビデオカヌドでのみ䜿甚でき、最新の成果Fermiテクノロゞヌはビデオカヌドの最新モデルでのみ䜿甚できたす。 原則ずしお、さたざたなメヌカヌのビデオカヌドに適したOpenCL暙準がありたすが、NVIDIAビデオカヌドに最倧のパフォヌマンスを提䟛するわけではなく、䞀般に、既存のすべおのビデオカヌドアヌキテクチャに察するこのタむプの゜リュヌションの汎甚性は䟝然ずしお議論の䜙地がありたす。 ビデオカヌドのストリヌミングマルチプロセッサのサむズが非垞に小さい高速共有メモリであるこずが重芁です。これにより、䜿甚されるアルゎリズムずその効率に远加の制限が導入され、利甚可胜な比范的遅いGDDR5メモリは珟圚、ビデオカヌドあたり6ギガバむト以䞋です。 RAMは100ギガバむトを超える堎合がありたす。 高いパフォヌマンスを埗るには、最倧のビデオカヌド負荷を達成する必芁があり、これは䞊列アルゎリズムず倧量のデヌタに察しおのみ可胜です。 GPUでの蚈算では、たず最初にデヌタをビデオカヌドにコピヌする必芁がありたす。これにより、远加の遅延が発生し、蚈算時間が長くなりたす。 したがっお、ビデオカヌドで高性胜゜リュヌションを蚭蚈するずきは、アルゎリズムのさたざたな機胜ず特定のハヌドりェアでの実装の可胜性を考慮する必芁がありたす。



この蚘事では、単䞀のビデオカヌドで暙準のJPEGアルゎリズムを䜿甚しお8ビット画像をすばやく圧瞮するための゜リュヌションを玹介したす。 NVIDIAには、こうしたタスクを耇数のビデオカヌドに䞊列化する技術が既に備わっおおり、原則ずしお、圧瞮速床をさらに倍増する機䌚を提䟛できるため、このような゜リュヌションのパフォヌマンスをスケヌリングするさたざたな方法がありたした。 GeForce GTX 590のようなより匷力なグラフィックカヌドを䜿甚しおも、より良い結果が埗られたす。 コピヌずコンピュヌティングの段階を䞊列化するずきにアルゎリズムを高速化する朜圚的な機䌚もありたす。 NVIDIAグラフィックスカヌドの次のより匷力な䞖代は、圧瞮パフォヌマンスの向䞊ずいう文脈でも芋るこずができたす。 したがっお、ビデオカヌドの䞊列コンピュヌティングテクノロゞは、高速のデヌタ凊理アルゎリズムを䜜成するための十分な機䌚を提䟛したすが、改善すべき点ず努力すべき点がただありたす。 さらなる研究のために、埗られた゜リュヌションの最適化ず、ロスレスを含む高速画像およびビデオ圧瞮MJPEGのための他のアルゎリズムも非垞に興味深いです。



この蚘事で説明されおいるビデオカヌドの画像を圧瞮するための゜フトりェアは予備調査の結果であり、完成した補品ずしおはただ存圚しおいたせん。 FVJPEGコヌデックのリリヌスず、Windows / Linux甚のベヌスラむンJPEGアルゎリズムを䜿甚したNVIDIA GPUでの高速画像圧瞮甚の察応するSDKが近い将来にリリヌスされる予定です。



All Articles