ARMプロセッサ? 練習。 マーベルアルマダXP

まず最初に、提供されたテストプラットフォームについて、RikorとOlegに個人的に感謝します。 前と同じように、 Marvell Armada XPテストを自分用に受けることができます。将来的には、テスターとして、わずかな料金で使用することができます。 前の記事「 ARM上のサーバー」で約束したように ロシア製! -ARMプロセッサでのサーバーパフォーマンステストを行います。 ARMはSystem-On-Chipテクノロジを使用して作成されたプロセッサであるため、プロセッサのパフォーマンスに焦点を当てます。

World Wide Webには多くのテストがありますが、それらはすべて私たちにとって火星への素晴らしい旅のようなものです-それがどのように行われたか、どのリビジョンのプロセッサ(または別のメーカー)、どのソフトウェアが使用されたかは明らかではありません。 そしてここ-私たちの目の前のサーバー、それはテストするためだけに残っています。







テストスタンド:



1) Core2 Quad:



OS: CentOSリリース5.7

プロセッサー: Quad-CoreIntel®Core(TM)2 Quad CPU Q9450 @ 2.66GHz

RAM: MemTotal 3939800kB



2) Atom D510:



OS: Ubuntu 12.04.3

プロセッサー: 2コアIntel®Atom(TM)CPU D510 @ 1.66GHz、4スレッド

RAM: MemTotal 4032060kB



3) Marvell Armada XP:



OS: Ubuntu 12.04.3

プロセッサー: 4-core Marvell PJ4Bv7 Processor rev 2(v7l)

RAM: MemTotal 8019640 kB



3つすべてのWDブラックスタンドのハードドライブ。 Core 2 QuadおよびAtom D510のRAMには最大量がかかります。



sysbench-プロセッサテスト





このテストは、4つのスレッドと、プロセッサへの10,000リクエストで開始されました。



Core2クワッド
テスト実行の概要:

合計時間:2.5107秒

イベントの総数:10000

イベント実行にかかった合計時間:10.0303

リクエストごとの統計:

最小:0.95ms

平均:1.00ms

最大:487.26ms

約 95パーセンタイル:0.95ms







アトムアトムd510
テスト実行の概要:

合計時間:37.6966s

イベントの総数:10000

イベント実行にかかった合計時間:150.7424

リクエストごとの統計:

最小:9.18ms

平均:15.07ms

最大:39.05ms

約 95パーセンタイル:15.09ms





ARMアルマダXP
テスト実行の概要:

合計時間:67.4705s

イベントの総数:10000

イベント実行にかかった合計時間:269.7890

リクエストごとの統計:

最小:26.66ms

平均:26.98ms

最大:57.05ms

約 95パーセンタイル:27.10ms











OLTPテスト-sysbenchを使用したMySQLのパフォーマンス





最初に、10,000レコードのinnoDBテーブルを作成します。 チーム



sysbench —test=oltp —mysql-table-engine=innodb —oltp-table-size=10000 —mysql-user=root —mysql-password=root —db-driver=mysql —test=oltp prepare







それからチーム



sysbench --num-threads=8 --max-requests=500 --oltp-table-size=10000 --mysql-user=root --mysql-password=root --db-driver=mysql --test=oltp run







前の手順で作成されたテーブルで8つのクライアント(クエリの最大数は500)でテストを実行します。



テスト出力:



アトムアトムd510
次のオプションを使用してテストを実行します。

スレッド数:8

乱数ジェネレータシードは0であり、無視されます



スレッドが開始しました!



OLTPテスト統計:

実行されたクエリ:

読む:7028

書く:2008

その他:1004

合計:10040

トランザクション:502(93.89 /秒)

デッドロック:0(0.00 /秒)

読み取り/書き込み要求:9036(1690.02 /秒)

その他の操作:1004(187.78 /秒)



一般的な統計:

合計時間:5.3467秒

イベントの総数:502

イベントの実行にかかった合計時間:42.2692s

応答時間:

最小:57.34ms

平均:84.20ms

最大:129.67ms

約 95パーセンタイル:100.21ms



スレッドの公平性:

イベント(avg / stddev):62.7500 / 0.66

実行時間(avg / stddev):5.2836 / 0.03





マーベルアルマダXP
次のオプションを使用してテストを実行します。

スレッド数:8



OLTPテストを実行します。

混合OLTPテストの実行

特殊分布を使用(12回の反復、75 pctの場合に1 pctの値が返されます)

「BEGIN」を使用してトランザクションを開始する

id列でauto_incを使用する

OLTPテストの最大リクエスト数は500に制限されています

スレッドが開始しました!

完了



OLTPテスト統計:

実行されたクエリ:

読む:7000

書き込み:2500

その他:1000

合計:10500

トランザクション:500(361.28 /秒)

デッドロック:0(0.00 /秒)

読み取り/書き込み要求:9500(毎秒6864.24)

その他の操作:1000(1秒あたり722.55)



テスト実行の概要:

合計時間:1.3840秒

イベントの総数:500

イベント実行にかかった合計時間:11.0083

リクエストごとの統計:

最小:8.47ms

平均:22.02ms

最大:55.15ms

約 95パーセンタイル:39.44ms



スレッドの公平性:

イベント(avg / stddev):62.5000 / 1.87

実行時間(avg / stddev):1.3760 / 0.00





比較のために、トランザクション(トランザクション)、読み取り/書き込み要求(読み取り/書き込み要求)、その他の操作(その他の操作)の3つのインジケーターを使用します。

デッドロックは発生しません。なぜなら、 両方のプラットフォームで同じであり、ゼロです。







7zipを使用した情報のアーカイブ





ランダムに生成された1 GBのデータをアーカイブします。



du -sh /tmp/ramfs/file

1.0G /tmp/ramfs/file

time 7za a dummy -mmt=4 -txz -so /tmp/ramfs/file | dd of=/dev/null









コア2クワッド
7-Zip(A)[64] 9.20 Copyright©1999-2010 Igor Pavlov 2010-11-18

p7zipバージョン9.20(ロケール= C、Utf16 =オフ、HugeFiles =オン、4 CPU)

スキャン中



アーカイブ標準出力の作成



すべてがOKです

2093146 + 15レコード

2093159 + 1レコード

1071697500バイト(1.1 GB)コピー、160.375秒、6.7 MB / s



実2m40.376s

ユーザー8m11.635s

sys 0m5.290s





アトムアトムd510
7-Zip(A)[64] 9.20 Copyright©1999-2010 Igor Pavlov 2010-11-18

p7zipバージョン9.20(ロケール= C、Utf16 =オフ、HugeFiles =オン、4 CPU)

スキャン中



アーカイブ標準出力の作成



すべてがOKです

2097252 + 15レコード

2097263 + 1レコード

1073798860バイト(1.1 GB)コピー、557.429秒、1.9 MB /秒



実際の9分17.434秒

ユーザー34m46.120s

sys 0m26.012s





マーベルアルマダXP
7-Zip(A)9.20 Copyright©1999-2010 Igor Pavlov 2010-11-18

p7zipバージョン9.20(ロケール= C、Utf16 =オフ、HugeFiles =オン、4 CPU)

スキャン中



アーカイブ標準出力の作成



すべてがOKです

2097249 + 17レコード

2097263 + 1レコード

1073798860バイト(1.1 GB)コピー、578.709秒、1.9 MB /秒



実際の9分38.713秒

ユーザー32m26.630s

sys 0m21.290s









7zipの圧縮および解凍テスト





コア2クワッド
7-Zip(A)[64] 9.20 Copyright©1999-2010 Igor Pavlov 2010-11-18

p7zipバージョン9.20(ロケール= ru_RU.UTF-8、Utf16 =オン、HugeFiles =オン、4 CPU)



RAMサイズ:3847 MB​​、#CPUハードウェアスレッド:4

RAM使用量:850 MB、#ベンチマークスレッド:4



ダクト圧縮| 減圧

速度使用率R / U評価| 速度使用率R / U評価

KB / s%MIPS MIPS | KB / s%MIPS MIPS



22:8950 339 2569 8706 | 117613 397 2675 10611

23:7510 294 2604 7651 | 115900 398 2666 10606

24:8044 326 2653 8649 | 113672 398 2651 10546

25:7424 311 2728 8477 | 112064 399 2642 10538

-Avr:317 2638 8371 398 2659 10575

合計:358 2,648 9,473





アトムアトムd510
7-Zip(A)[64] 9.20 Copyright©1999-2010 Igor Pavlov 2010-11-18

p7zipバージョン9.20(ロケール= en_US.UTF-8、Utf16 =オン、HugeFiles =オン、4 CPU)



RAMサイズ:3937 MB、#CPUハードウェアスレッド:4

RAM使用量:850 MB、#ベンチマークスレッド:4



ダクト圧縮| 減圧

速度使用率R / U評価| 速度使用率R / U評価

KB / s%MIPS MIPS | KB / s%MIPS MIPS



22:1895 312 591 1843 | 34517 398 782 3114

23:1871 317 602 1906 | 34142 399 783 3124

24:1845 325 610 1984 | 33684 399 783 3125

25:1794 331 618 2048 | 30397 354 806 2858

-Avr:321 605 1945 388 788 3055

合計:354 697 2500





マーベルアルマダXP
7-Zip(A)9.20 Copyright©1999-2010 Igor Pavlov 2010-11-18

p7zipバージョン9.20(ロケール= en_US.UTF-8、Utf16 =オン、HugeFiles =オン、4 CPU)



RAMサイズ:7831 MB、#CPUハードウェアスレッド:4

RAM使用量:850 MB、#ベンチマークスレッド:4



ダクト圧縮| 減圧

速度使用率R / U評価| 速度使用率R / U評価

KB / s%MIPS MIPS | KB / s%MIPS MIPS



22:1662 282 573 1616 | 45116 394 1034 4070

23:1645 286 587 1676 | 44412 393 1033 4064

24:1636 291 604 1759 | 43816 394 1032 4065

25:1626 296 628 1856 | 43331396 1029 4074

-Avr:288598 1727 394 1032 4068

合計:341 815 2898





グラフでは、圧縮率と圧縮解除率の平均値を取ります。







Openssl速度でのパフォーマンステスト





マルチプロセッシング(4つの同時実行プロセス)により、ベンチマーク出力は読み込めませんが、本質はさまざまなタイプの暗号化の計算です。 ここでは、タスクの合計実行時間とプログラム出力の最後の部分が重要です。



コア2クワッド
OpenSSL 0.9.8e-fips-rhel5 2008年7月1日

ビルド:Tue Feb 7 05:45:53 EST 2012

オプション:bn(64,64)md2(int)rc4(ptr、int)des(idx、cisc、16、int)aes(部分)blowfish(ptr2)

コンパイラ:gcc -fPIC -DOPENSSL_PIC -DZLIB -DOPENSSL_THREADS -D_REENTRANT -DDSO_DLFCN -DHAVE_DLFCN_H -DKRB5_MIT -I / usr / kerberos / include_DALL-WALLIT_DALL_WALL-WALLTEG-WALLET = 2 -fexceptions -fstackプロテクター--param = SSP-バッファサイズ= 4 -m64 -mtune =ジェネリック-Wa、 - noexecstack -DOPENSSL_USE_NEW_FUNCTIONS -fno-厳密エイリアシング-DOPENSSL_BN_ASM_MONT -DSHA1_ASM -DSHA256_ASM -DSHA512_ASM -DMD5_ASM - DAES_ASM

使用可能なタイミングオプション:TIMES TIMEB HZ = 100 [sysconf値]

使用されるタイミング関数:



実7分21.644秒

ユーザー0m0.002s

sys 0m0.001s





アトムアトムd510
OpenSSL 1.0.1 2012年3月14日

構築日:火6月4日07:26:06 UTC 2013

オプション:bn(64,64)rc4(16x、int)des(idx、cisc、16、int)aes(部分)blowfish(idx)

コンパイラー:cc -fPIC -DOPENSSL_PIC -DZLIB -DOPENSSL_THREADS -D_REENTRANT -DDSO_DLFCN -DHAVE_DLFCN_H -m64 -DL_ENDIAN -DTERMIO -g -O2 -fstack-protector --param = ssp-format-buffer-size-buffer-size-buffer-size-buffer-size =フォーマットセキュリティ-D_FORTIFY_SOURCE = 2 -Wl、-Bsymbolic関数-Wl、-z、relro -Wa、 - noexecstack -Wall -DOPENSSL_NO_TLS1_2_CLIENT -DOPENSSL_MAX_TLS1_2_CIPHER_LENGTH = 50 -DMD32_REG_T = INT -DOPENSSL_IA32_SSE2 -DOPENSSL_BN_ASM_MONT -DOPENSSL_BN_ASM_MONT5 -DOPENSSL_BN_ASM_GF2m -DSHA1_ASM -DSHA256_ASM -DSHA512_ASM -DMD5_ASM -DAES_ASM -DVPAES_ASM -DBSAES_ASM -DWHIRLPOOL_ASM -DGHASH_ASM



実16分37.958秒

ユーザー0m0.016s

sys 0m0.000s





マーベルアルマダXP
OpenSSL 1.0.1 2012年3月14日

作成日:火6月4日07:43:19 UTC 2013

オプション:bn(64.32)rc4(ptr、char)des(idx、cisc、16、long)aes(部分)blowfish(ptr)

コンパイラ:cc -fPIC -DOPENSSL_PIC -DZLIB -DOPENSSL_THREADS -D_REENTRANT -DDSO_DLFCN -DHAVE_DLFCN_H -DL_ENDIAN -DTERMIO -g -O2 -fstack-protector --param = ssp-buffer-sizeWer-format = 4wat-format-wor-format = 4wat -security -D_FORTIFY_SOURCE = 2 -Wl、-Bsymbolic関数-Wl、-z、relro -Wa、 - noexecstack -Wall -DOPENSSL_NO_TLS1_2_CLIENT -DOPENSSL_MAX_TLS1_2_CIPHER_LENGTH = 50 -DOPENSSL_BN_ASM_MONT -DOPENSSL_BN_ASM_GF2m -DSHA1_ASM -DSHA256_ASM -DSHA512_ASM -DAES_ASM -DGHASH_ASM



実16m39.221s

ユーザー0m0.010s

sys 0m0.010s









Phoronix Test Suiteを使用して、プラットフォームのプロセッサをテストします





アトムアトムd510
Phoronixテストスイートv3.6.1



インストール済み:pts / polybench-c-1.0.2



PolyBench-Cテスト構成



テスト:



1:3行列乗算

2:相関計算

3:共分散計算

4:すべてのオプションをテストする



あなたの選択を入力してください:

システム情報



ハードウェア:

プロセッサー:Intel Atom D510 @ 1.66GHz(4コア)、マザーボード:Intel D510MO、チップセット:Intel N10ファミリーDMI、メモリー:2 x 2048 MB DDR2-800MHz、ディスク:320GB Hitachi HTS54323、グラフィックス:Intel N10ファミリーIGP、オーディオ: Realtek ALC662 rev1、ネットワーク:Realtek RTL8111 / 8168B



ソフトウェア:

OS:Ubuntu 12.04、カーネル:3.8.0-29-generic(x86_64)、ディスプレイドライバー:intel、コンパイラー:GCC 4.6、ファイルシステム:ext4、画面解像度:1280x800



これらのテスト結果を保存しますか(Y / n):

推定実行時間:10分



PolyBench-C 3.2:

pts / polybench-c-1.0.2 [テスト:3行列乗算]

テスト1/3

推定試行回数:3

推定テスト実行時間:4分

完了までの推定時間:10分

Run 1 @ 15:58:43を開始

実行2 @ 16:06:02を開始

Run 3 @ 16:13:16を開始[標準 Dev:0.08%]



テスト結果:

432.50632214546

431.82482385635

432.36951303482



平均:432.23秒



PolyBench-C 3.2:

pts / polybench-c-1.0.2 [テスト:相関計算]

テスト2/3

推定試行回数:3

推定テスト実行時間:4分

完了までの推定時間:7分

実行1 @ 16:20:34を開始

実行2 @ 16:21:03を開始

Run 3 @ 16:21:32を開始[標準 Dev:0.80%]



テスト結果:

27.11058306694

26.767813205719

26.717456102371



平均:26.87秒



PolyBench-C 3.2:

pts / polybench-c-1.0.2 [テスト:共分散計算]

テスト3/3

推定試行回数:3

完了までの推定時間:4分

実行1 @ 16:22:05を開始

Run 2 @ 16:22:36を開始

Run 3 @ 16:23:05を開始[標準 開発:4.04%]

Run 4 @ 16:23:34を開始[標準 開発:3.70%]

Run 5 @ 16:24:05を開始[標準 開発:3.66%]

Run 6 @ 16:24:37 [Std。 開発:4.24%]



テスト結果:

29.076143026352

26.863905906677

27.619282960892

28.831228017807

29.238312959671

26.504108190536



平均:28.02秒



実55m28.781s

ユーザー25m44.476s

sys 0m1.728s





マーベルアルマダXP
Phoronixテストスイートv3.6.1



インストール済み:pts / polybench-c-1.0.2



PolyBench-Cテスト構成



テスト:



1:3行列乗算

2:相関計算

3:共分散計算

4:すべてのオプションをテストする



あなたの選択を入力してください:

システム情報



ハードウェア:

プロセッサー:Marvell- PJ4Bv7 rev 2(4コア)、マザーボード:Marvell Armada XP GPボード、メモリー:8192MB、ディスク:640GB JMicron H / W RAID



ソフトウェア:

OS:Ubuntu 12.04、カーネル:3.2.40-1-armadaxp(armv7l)、コンパイラ:GCC 4.6、ファイルシステム:ext4



これらのテスト結果を保存しますか(Y / n):

推定実行時間:7分



PolyBench-C 3.2:

pts / polybench-c-1.0.2 [テスト:3行列乗算]

テスト1/3

推定試行回数:3

推定テスト実行時間:3分

完了までの推定時間:7分

Run 1 @ 15:58:14を開始しました

実行2 @ 16:05:08を開始

Run 3 @ 16:11:51 [Std。 開発:1.06%]



テスト結果:

409.0100030899

400.97810292244

407.59055900574



平均:405.86秒



PolyBench-C 3.2:

pts / polybench-c-1.0.2 [テスト:相関計算]

テスト2/3

推定試行回数:3

推定テスト実行時間:3分

完了までの推定時間:5分

実行1 @ 16:18:44を開始

実行2 @ 16:19:26を開始

Run 3 @ 16:20:08を開始[標準 開発:0.10%]



テスト結果:

39.603915929794

39.637764930725

39.679361104965



平均:39.64秒



PolyBench-C 3.2:

pts / polybench-c-1.0.2 [テスト:共分散計算]

テスト3/3

推定試行回数:3

完了までの推定時間:3分

Run 1 @ 16:20:53を開始しました

実行2 @ 16:21:35を開始

Run 3 @ 16:22:17 [Std。 Dev:0.03%]



テスト結果:

39.610389947891

39.589015960693

39.614406108856



平均:39.60秒



実53m46.279s

ユーザー24m14.830s

sys 0m1.350s









誰もが自分でテストから結論を出すことができます。 私たちの調査結果では、ARMはAtom D510レベルです。 同時に、アーキテクチャへの適応が始まったばかりで、Aarch64(ARM64)を楽しみにしています。



次の記事では、ARMプラットフォーム上のさまざまなアプリケーションの動作をテストした結果を提示する予定です。 計画には、さまざまなホスティングコントロールパネル、さまざまなCMSが含まれます。 何かをテストする場合は、zbg @ globatel.ruに書き込みます






All Articles