Search <book_title>...

Veritas NetBackup™ Appliance 容量計画とパフォーマンスチューニングガイド

Last Published: 2018-03-08

Product(s): Appliances (3.1.1 (5340), 3.1.1 (5330), 3.1.1 (5230), 3.1.1 (5220), 3.1 (5340), 3.1 (5330), 3.1 (5230), 3.1 (5220))

CPU の監視と調整について

表: サンプル vmstat 出力（vmstat 5 で収集される）に、120 ストリームの 98% の重複排除バックアップジョブが 53xx アプライアンスで動作している場合の vmstat コマンドのサンプル出力を示します。

表: サンプル vmstat 出力（vmstat 5 で収集される）

r	swpd	Free	Buff	キャッシュ	si	us	sy	id
89	1006344	348907856	37632	11694512	0	62	30	8
84	1006316	348450264	37640	12016276	11	62	30	8
63	1006316	348104004	37664	12260816	0	63	30	7
76	1006288	347857280	37664	12491148	5	61	29	9
46	1006288	347538340	37684	12756108	0	61	30	8
72	1006260	347111556	37692	13083760	3	62	30	8
72	1006252	346786820	37692	13332416	6	62	30	8
61	1006164	346485836	37712	13612680	28	59	29	13
92	1006156	346136540	37720	13902248	0	60	30	10
106	1006132	345721588	37724	14190992	6	61	31	9
82	1006128	345355448	37732	14465996	0	61	30	9
113	1005972	345072276	37740	14760008	30	61	30	10
66	1005964	344747824	37740	15004520	1	61	30	9
98	1005924	344446500	37748	15282376	8	60	30	10
118	1005920	344035148	37760	15582400	0	61	30	9
96	1005900	343802084	37764	15882380	4	62	30	9
60	1005900	343406276	37784	16175128	0	58	29	13
61	1005872	343038168	37792	16470724	3	62	30	7
60	1005868	342653976	37792	16747684	1	61	30	9
116	1005836	342343076	37800	17001952	5	62	30	8

メモ:

表示を簡略化するために、出力の列の一部が削除されました。

上記の表で、id列（アイドル状態である CPU の %を示す）のほとんどが 1 桁であるため、システムが CPU バインドであることがわかります。これは、53xx の CPU の使用率が常に 90% を超えていることを示します。また、最初の列 r からもシステムが CPU バインドであることを示しています。列 r の値は 46 から 118 の間で変動します。 r は「CPU でキューを実行する準備ができている」ことを示します。これは、現在実行しているか、または実行する準備ができていて CPU の解放を待機しているプロセス数です。 53xx には 40 個の論理 CPU スレッドがあり、一度に最大 40 個のプロセスを同時に処理できます。列 r の値から 40 を引くと、実行する準備ができていて CPU サイクルを待機しているプロセスの数を導き出すことができます。

上記の CPU 統計と 120 の同時 98% バックアップストリームを実行している間にこれが発生するという事実によって、CPU の使用率を下げるために 2 つのアクションを実行できます。

ジョブのバッチサイズを小さくする。 CPU が過剰にビジー状態である場合は、利用可能な CPU サイクルを待機するため、ジョブに時間がかかりすぎる可能性があります。バッチごとの同時実行ジョブ数を減らすと、全体のパフォーマンスが向上することがあります。
フィンガープリントサーバーとして別の 53xx を追加し、CPU 容量を 2 倍にすることは理にかなった解決策です。

追加のフィンガープリントサーバーを使用した簡単な内部実験では、パフォーマンスが約 40% 向上して最大 10 GB/秒となり、アプライアンスの CPU の使用率が 50% 下がることがわかりました。現時点では、53xx は最大 10 x 10 Gbps の NIC をサポートし、ネットワークスループットを約 10 GB/秒に抑えるため、ボトルネックはネットワークになっています。システムに 10 x 10 Gbps を超える NIC をインストールしている場合は、さらにパフォーマンスが向上する可能性があります。