Veritas NetBackup™ Appliance 容量計画とパフォーマンスチューニングガイド
- このマニュアルについて
- 第 I 部 容量計画
- 第 II 部 ベストプラクティス
- 第 III 部 パフォーマンスチューニング
- 第 IV 部 容量計画とパフォーマンスチューニングのクイックリファレンス
CPU の監視と調整について
表: vmstat のサンプル出力 (vmstat 5 で収集) に、120 ストリームの 98% の重複排除バックアップジョブが 53xx アプライアンスで動作している場合のvmstat コマンドのサンプル出力を示します。
表: vmstat のサンプル出力 (vmstat 5 で収集)
r |
b |
swpd |
空き (Free) |
Buff |
キャッシュ (cache) |
si |
so |
us |
sy |
id |
wa |
---|---|---|---|---|---|---|---|---|---|---|---|
89 |
0 |
1006344 |
348907856 |
37632 |
11694512 |
0 |
0 |
62 |
30 |
8 |
0 |
84 |
0 |
1006316 |
348450264 |
37640 |
12016276 |
11 |
0 |
62 |
30 |
8 |
0 |
63 |
0 |
1006316 |
348104004 |
37664 |
12260816 |
0 |
0 |
63 |
30 |
7 |
0 |
76 |
0 |
1006288 |
347857280 |
37664 |
12491148 |
5 |
0 |
61 |
29 |
9 |
0 |
46 |
0 |
1006288 |
347538340 |
37684 |
12756108 |
0 |
0 |
61 |
30 |
8 |
0 |
72 |
0 |
1006260 |
347111556 |
37692 |
13083760 |
3 |
0 |
62 |
30 |
8 |
0 |
72 |
0 |
1006252 |
346786820 |
37692 |
13332416 |
6 |
0 |
62 |
30 |
8 |
0 |
61 |
0 |
1006164 |
346485836 |
37712 |
13612680 |
28 |
0 |
59 |
29 |
13 |
0 |
92 |
0 |
1006156 |
346136540 |
37720 |
13902248 |
0 |
0 |
60 |
30 |
10 |
0 |
106 |
0 |
1006132 |
345721588 |
37724 |
14190992 |
6 |
0 |
61 |
31 |
9 |
0 |
82 |
0 |
1006128 |
345355448 |
37732 |
14465996 |
0 |
0 |
61 |
30 |
9 |
0 |
113 |
0 |
1005972 |
345072276 |
37740 |
14760008 |
30 |
0 |
61 |
30 |
10 |
0 |
66 |
0 |
1005964 |
344747824 |
37740 |
15004520 |
1 |
0 |
61 |
30 |
9 |
0 |
98 |
0 |
1005924 |
344446500 |
37748 |
15282376 |
8 |
0 |
60 |
30 |
10 |
0 |
118 |
0 |
1005920 |
344035148 |
37760 |
15582400 |
0 |
0 |
61 |
30 |
9 |
0 |
96 |
0 |
1005900 |
343802084 |
37764 |
15882380 |
4 |
0 |
62 |
30 |
9 |
0 |
60 |
0 |
1005900 |
343406276 |
37784 |
16175128 |
0 |
0 |
58 |
29 |
13 |
0 |
61 |
0 |
1005872 |
343038168 |
37792 |
16470724 |
3 |
0 |
62 |
30 |
7 |
0 |
60 |
0 |
1005868 |
342653976 |
37792 |
16747684 |
1 |
0 |
61 |
30 |
9 |
0 |
116 |
0 |
1005836 |
342343076 |
37800 |
17001952 |
5 |
0 |
62 |
30 |
8 |
0 |
メモ:
表示を簡略化するために、出力の列の一部が削除されました。
上記の表で、id列(アイドル状態である CPU の %を示す)のほとんどが 1 桁であるため、システムが CPU バインドであることがわかります。これは、53xx の CPU の使用率が常に 90% を超えていることを示します。また、最初の列 r からもシステムが CPU バインドであることを示しています。列 r の値は 46 ~ 118 の間で変動します。r は「キューを実行する準備ができた CPU」を意味します。これは、現在実行中または実行する準備ができていたが CPU の空きを待機しているプロセスの数です。53xx には 40 の論理 CPU スレッドがあります。最大で一度に 40 のプロセスを同時に処理できます。列 r の値から 40 を引くと、実行する準備ができていて CPU サイクルを待機しているプロセスの数を導き出すことができます。
上記の CPU 統計と 120 の同時 98% バックアップストリームを実行している間にこれが発生するという事実によって、CPU の使用率を下げるために 2 つのアクションを実行できます。
ジョブのバッチサイズを小さくする。CPU が過剰にビジー状態である場合は、利用可能な CPU サイクルを待機するため、ジョブに時間がかかりすぎる可能性があります。バッチごとの同時実行ジョブ数を減らすと、全体のパフォーマンスが向上することがあります。
フィンガープリントサーバーとして別の 53xx を追加し、CPU 容量を 2 倍にすることは理にかなった解決策です。
追加のフィンガープリントサーバーを使用した簡単な内部実験では、パフォーマンスが約 40% 向上して最大 10 GB/秒となり、アプライアンスの CPU の使用率が 50% 下がることがわかりました。現時点では、53xx は最大 10 x 10 Gbps の NIC をサポートし、ネットワークスループットを約 10 GB/秒に抑えるため、ボトルネックはネットワークになっています。システムに 10 x 10 Gbps を超える NIC をインストールしている場合は、さらにパフォーマンスが向上する可能性があります。