xz-LZMA圧縮力はすでにコンソールにあります

多くの人は、おそらく圧縮/解凍xzのユーティリティについてすでに知っています。 しかし、彼らはそれ以上知りません。 したがって、私はこの事実発見トピックを書きました。



xz-gnu-shnyhアプリケーションに含まれるgzip、bzip2とともにデータ圧縮形式。

7zと同じLZMAアルゴリズムを使用します。これは、上記の標準データと比較して、テキスト、まだ圧縮されていないバイナリデータなど、多くのタイプのデータをより強力に圧縮できることを意味します。

xzは、rpmパッケージ (Fedora 12で使用)で.cpioアーカイブ圧縮するために、新しいrpm 4.7.2で使用されます

ArchLinuxは通常、.tar.xzをパッケージとして使用します。

GNU tarは、-J --lzmaオプションを導入します。これは、gzipの-z、bzip2の-jと同じ役割を果たします。



長所:

高い圧縮率



短所:

高いリソース消費:

CPU時間(および実際の圧縮時間)

メモリ(設定可能ですが、gzip、bzip2以上)。

特に、 -best aka -9指定した xzは最大700MBを消費します! 圧縮と90 mbの解凍



機能:

大量のメモリの消費は、利用可能なリソースの予備計算によってわずかに制限されます。

GNU tar統合

ストリームを操作する

オプション:--verboseによるプログレスバー



事実調査のトピックをグラフなどで詰まらせる気はありませんが、それなしではできません。

私は、圧縮の程度、時間の消費のために、通常の実行gzip、bzip2、xzを作成しました。 WinRarもゲストとして参加します(ただし、ワインの下で酔っぱらいましたが、それでも優れた結果を示しました)。





この写真はクリック性に優れています
テストデータとして、Fedorinカーネル2.6.27の拡張ブランチを取得し、292 MBの容量を持つtarに収集して、測定を行いました。 垂直方向の圧縮レベル(時間)、水平方向-費やされた時間。



xzはこのファイルを4.8から6.9回刺しました。

gzip 3.6-4.5

bzip2 4.5-5.6

winrar 4.5-6.7



4つの正方形を取得します。

左下-ゆっくりと弱く押す:gzipとwinrarが最速。

左上:圧縮率/時間比:bzip2、xzは1および2の圧縮レベルでわずかに優れています。

右上:実際のプレス機構:ドルですが、非常に厳密にxzを圧縮しています

右下:誰もいませんし、長時間実行し、弱く圧縮するアーカイバが必要なのは誰ですか?



しかし、一般的に、グリッドはうまくマッチしていません。時間をどのように評価するのでしょうか? カテゴリー! たとえば、すばやく-10〜20秒、平均で30分から1分、2分以上は長い時間です。

したがって、対数スケールはここでより明確になります。





また、Core2Duo E6750 @ 2.66GHzでストリーム圧縮として評価すると、

次に、そのようなグラフを得ました:



つまり gzip -1またはgzip -4コンベアをコンプレッサーとして使用すると、100Mbitネットワークで最大25 MB /秒の非圧縮データを駆動できます。 (数回チェック-何らかの理由でgzip -4は-3または-5よりも大きな利益をもたらします)

cat /some/data | gzip -1c | ssh user@somehost -c "gzip -dc > /some/data"





xzは<8mbitsのチャネルでのみ使用できます。



明白な結論(KOの協力を得て)


xz-リソースの消費を考慮して、圧縮のアーカイバのニッチを占有します。圧縮の程度が大きな役割を果たすことができ、十分なコンピューティングリソースと時間リソースがあります。 つまり さまざまなバックアップ/アーカイブ、ディストリビューション(rpm、archlinuxのtar.xz)。 または、データは非常に簡単に圧縮されます。ログ、テキストデジタルデータcsv、tsvを含むテーブルで、変更されることはありません。



PS xzがどんなに幸せであっても、WinRar Winsを費やした努力の知恵で。



All Articles