Veritas NetBackup™ Appliance 容量計画とパフォーマンスチューニングガイド
- このマニュアルについて
- 第 I 部 容量計画
- 第 II 部 ベストプラクティス
- 第 III 部 パフォーマンスチューニング
- 第 IV 部 容量計画とパフォーマンスチューニングのクイックリファレンス
CPU の監視と調整について
表: サンプル vmstat 出力(vmstat 5 で収集される) に、120 ストリームの 98% の重複排除バックアップジョブが 53xx アプライアンスで動作している場合の vmstat コマンドのサンプル出力を示します。
表: サンプル vmstat 出力(vmstat 5 で収集される)
r | b | swpd | Free | Buff | キャッシュ | si | so | us | sy | id | wa |
---|---|---|---|---|---|---|---|---|---|---|---|
89 | 0 | 1006344 | 348907856 | 37632 | 11694512 | 0 | 0 | 62 | 30 | 8 | 0 |
84 | 0 | 1006316 | 348450264 | 37640 | 12016276 | 11 | 0 | 62 | 30 | 8 | 0 |
63 | 0 | 1006316 | 348104004 | 37664 | 12260816 | 0 | 0 | 63 | 30 | 7 | 0 |
76 | 0 | 1006288 | 347857280 | 37664 | 12491148 | 5 | 0 | 61 | 29 | 9 | 0 |
46 | 0 | 1006288 | 347538340 | 37684 | 12756108 | 0 | 0 | 61 | 30 | 8 | 0 |
72 | 0 | 1006260 | 347111556 | 37692 | 13083760 | 3 | 0 | 62 | 30 | 8 | 0 |
72 | 0 | 1006252 | 346786820 | 37692 | 13332416 | 6 | 0 | 62 | 30 | 8 | 0 |
61 | 0 | 1006164 | 346485836 | 37712 | 13612680 | 28 | 0 | 59 | 29 | 13 | 0 |
92 | 0 | 1006156 | 346136540 | 37720 | 13902248 | 0 | 0 | 60 | 30 | 10 | 0 |
106 | 0 | 1006132 | 345721588 | 37724 | 14190992 | 6 | 0 | 61 | 31 | 9 | 0 |
82 | 0 | 1006128 | 345355448 | 37732 | 14465996 | 0 | 0 | 61 | 30 | 9 | 0 |
113 | 0 | 1005972 | 345072276 | 37740 | 14760008 | 30 | 0 | 61 | 30 | 10 | 0 |
66 | 0 | 1005964 | 344747824 | 37740 | 15004520 | 1 | 0 | 61 | 30 | 9 | 0 |
98 | 0 | 1005924 | 344446500 | 37748 | 15282376 | 8 | 0 | 60 | 30 | 10 | 0 |
118 | 0 | 1005920 | 344035148 | 37760 | 15582400 | 0 | 0 | 61 | 30 | 9 | 0 |
96 | 0 | 1005900 | 343802084 | 37764 | 15882380 | 4 | 0 | 62 | 30 | 9 | 0 |
60 | 0 | 1005900 | 343406276 | 37784 | 16175128 | 0 | 0 | 58 | 29 | 13 | 0 |
61 | 0 | 1005872 | 343038168 | 37792 | 16470724 | 3 | 0 | 62 | 30 | 7 | 0 |
60 | 0 | 1005868 | 342653976 | 37792 | 16747684 | 1 | 0 | 61 | 30 | 9 | 0 |
116 | 0 | 1005836 | 342343076 | 37800 | 17001952 | 5 | 0 | 62 | 30 | 8 | 0 |
メモ:
表示を簡略化するために、出力の列の一部が削除されました。
上記の表で、id列(アイドル状態である CPU の %を示す)のほとんどが 1 桁であるため、システムが CPU バインドであることがわかります。 これは、53xx の CPU の使用率が常に 90% を超えていることを示します。また、最初の列 r からもシステムが CPU バインドであることを示しています。 列 r の値は 46 から 118 の間で変動します。 r は「CPU でキューを実行する準備ができている」ことを示します。 これは、現在実行しているか、または実行する準備ができていて CPU の解放を待機しているプロセス数です。 53xx には 40 個の論理 CPU スレッドがあり、一度に最大 40 個のプロセスを同時に処理できます。列 r の値から 40 を引くと、実行する準備ができていて CPU サイクルを待機しているプロセスの数を導き出すことができます。
上記の CPU 統計と 120 の同時 98% バックアップストリームを実行している間にこれが発生するという事実によって、CPU の使用率を下げるために 2 つのアクションを実行できます。
ジョブのバッチサイズを小さくする。 CPU が過剰にビジー状態である場合は、利用可能な CPU サイクルを待機するため、ジョブに時間がかかりすぎる可能性があります。バッチごとの同時実行ジョブ数を減らすと、全体のパフォーマンスが向上することがあります。
フィンガープリントサーバーとして別の 53xx を追加し、CPU 容量を 2 倍にすることは理にかなった解決策です。
追加のフィンガープリントサーバーを使用した簡単な内部実験では、パフォーマンスが約 40% 向上して最大 10 GB/秒となり、アプライアンスの CPU の使用率が 50% 下がることがわかりました。現時点では、53xx は最大 10 x 10 Gbps の NIC をサポートし、ネットワークスループットを約 10 GB/秒に抑えるため、ボトルネックはネットワークになっています。システムに 10 x 10 Gbps を超える NIC をインストールしている場合は、さらにパフォーマンスが向上する可能性があります。