Veritas NetBackup™ Appliance 容量計画とパフォーマンスチューニングガイド

Last Published:
Product(s): Appliances (3.1.1 (5340), 3.1.1 (5330), 3.1.1 (5230), 3.1.1 (5220), 3.1 (5340), 3.1 (5330), 3.1 (5230), 3.1 (5220))
  1. このマニュアルについて
    1.  
      このマニュアルについて
    2.  
      対象読者について
    3.  
      NetBackup アプライアンスのマニュアルについて
  2. 第 I 部 容量計画
    1. バックアップ要件の分析
      1. バックアップ要件の分析
        1.  
          何のバックアップを作成しますか。
        2.  
          どれだけの量のデータをバックアップしますか。
        3.  
          いつバックアップを行いますか。
        4.  
          保持期間の長さはどの程度ですか。
        5. バックアップ要件を記録する
          1.  
            コンピュータのシステム情報を記録するテンプレート
          2.  
            データベース情報を記録するテンプレート
          3.  
            アプリケーションサーバー情報を記録するテンプレート
    2. バックアップシステムの設計
      1.  
        企業向けバックアップシステムのユースケースの対応
      2.  
        リモートオフィスまたは支店のバックアップシステムのユースケースへの対応
      3. NetBackup Appliance について
        1.  
          マスターサーバーの役割について
        2.  
          メディアサーバーの役割について
      4.  
        NetBackup 53xx 高可用性ソリューションについて
      5. 新しいアプライアンスの選択
        1.  
          メディアサーバーの選択
        2.  
          マスターサーバーの選択
  3. 第 II 部 ベストプラクティス
    1. ベストプラクティスセクションについて
      1.  
        ベストプラクティスについて
      2.  
        メンテナンスサイトへの参照
    2. 重複排除ソリューションの実装について
      1.  
        重複排除ソリューションの実装について
      2.  
        一般的な推奨事項
      3.  
        Oracle
      4.  
        Microsoft SQL
      5.  
        DB2
      6.  
        Sybase
      7.  
        Lotus Notes
    3. ネットワークに関する注意事項
      1.  
        ネットワークに関する注意事項について
      2.  
        ファイバーチャネル接続について
      3. SAN ゾーンの設定について
        1.  
          NetBackup Appliance 用の SAN のゾーン化について
      4.  
        ネットワーク帯域幅の検証
    4. ストレージ構成
      1.  
        ストレージの構成概要
      2. 共有ストレージプールの構成について
        1.  
          バックアップの基本ストリーム数の計算
      3. パフォーマンス向上のためのストレージパーティションの移動について
        1. パーティションの移動
          1.  
            [<partition> の移動 (Move <partition>)]ダイアログ
        2.  
          NetBackup Appliance Shell Menu を使用したパーティションの移動
        3.  
          最適なパフォーマンスのために、MSDP パーティションをベースディスクから拡張ディスクに移動する
    5. 一般的なベストプラクティス
      1.  
        一般的なベストプラクティス
      2.  
        通知設定について
      3.  
        IPMI 構成について
      4.  
        ディザスタリカバリのベストプラクティス
      5.  
        ジョブのパフォーマンス
      6.  
        アーキテクチャ
      7.  
        NetBackup カタログのバックアップ
      8.  
        SLP (Storage Lifecycle Policy、ストレージライフサイクルポリシー) によるパッチ修正
      9.  
        アプライアンスを使った VMware バックアップ
      10.  
        NetBackup Appliance のリストアパフォーマンスの向上
  4. 第 III 部 パフォーマンスチューニング
    1. 役割ベースのパフォーマンスの監視
      1.  
        パフォーマンスに影響する要因としてのロールベースの設定
      2.  
        マスターサーバーのパフォーマンスに影響するもの
      3.  
        メディアサーバー (MSDP) のパフォーマンスに影響するもの
    2. ネットワーク設定の最適化とパフォーマンスの改善
      1.  
        ネットワーク設定の最適化とパフォーマンスの改善
      2.  
        SAN ファイバーチャネルの設定
      3.  
        ネットワーク結合
      4.  
        VMware VADP
      5.  
        増加した MTU に対するジャンボフレームの実装
    3. ストレージ構成
      1.  
        ストレージ構成
      2.  
        重複排除のディスク I/O と RAID レベルの設定
      3. RAID コントローラ操作
        1.  
          RAID コントローラコマンド
      4.  
        重複排除の負荷分散
      5.  
        ストレージライフサイクルポリシー
      6.  
        自動イメージレプリケーション (AIR)
      7.  
        AdvancedDisk の設定
      8.  
        テープ出力操作
    4. NetBackup Appliance のチューニング手順とパフォーマンスの監視
      1. パフォーマンスの診断に関する問題について
        1.  
          CPU の監視と調整について
        2.  
          メモリの監視と調整について
        3.  
          ネットワークの監視と調整について
        4.  
          I/O の監視と調整について
        5.  
          リソースのボトルネックを特定するための一般的なガイドライン
      2. パフォーマンスチューニングプラクティスについて
        1.  
          I/O パフォーマンス調整について
        2.  
          Oracle のバックアップとリストアのパフォーマンス調整について
        3.  
          WAN の最適化パフォーマンスの向上のための NetBackup クライアントでの NET_BUFFER_SZ の設定
      3. チューニング手順とパフォーマンスの監視について
        1. NetBackup クライアントのパフォーマンス
          1.  
            nbperfchk を使って NetBackup Appliance のディスクパフォーマンスを検証する
        2.  
          他のパフォーマンス監視コマンド
  5. 第 IV 部 容量計画とパフォーマンスチューニングのクイックリファレンス
    1. 容量計画のチェックリスト
      1.  
        容量計画のためのチェックリスト
      2.  
        容量測定のワークシート
    2. ベストプラクティスのチェックリスト
      1.  
        ベストプラクティスのチェックリスト
    3. アプライアンスのパフォーマンスの監視方法
      1.  
        アプライアンスのパフォーマンスの監視について
      2.  
        パフォーマンス監視表

CPU の監視と調整について

表: サンプル vmstat 出力(vmstat 5 で収集される) に、120 ストリームの 98% の重複排除バックアップジョブが 53xx アプライアンスで動作している場合の vmstat コマンドのサンプル出力を示します。

表: サンプル vmstat 出力(vmstat 5 で収集される)

r

b

swpd

Free

Buff

キャッシュ

si

so

us

sy

id

wa

89

0

1006344

348907856

37632

11694512

0

0

62

30

8

0

84

0

1006316

348450264

37640

12016276

11

0

62

30

8

0

63

0

1006316

348104004

37664

12260816

0

0

63

30

7

0

76

0

1006288

347857280

37664

12491148

5

0

61

29

9

0

46

0

1006288

347538340

37684

12756108

0

0

61

30

8

0

72

0

1006260

347111556

37692

13083760

3

0

62

30

8

0

72

0

1006252

346786820

37692

13332416

6

0

62

30

8

0

61

0

1006164

346485836

37712

13612680

28

0

59

29

13

0

92

0

1006156

346136540

37720

13902248

0

0

60

30

10

0

106

0

1006132

345721588

37724

14190992

6

0

61

31

9

0

82

0

1006128

345355448

37732

14465996

0

0

61

30

9

0

113

0

1005972

345072276

37740

14760008

30

0

61

30

10

0

66

0

1005964

344747824

37740

15004520

1

0

61

30

9

0

98

0

1005924

344446500

37748

15282376

8

0

60

30

10

0

118

0

1005920

344035148

37760

15582400

0

0

61

30

9

0

96

0

1005900

343802084

37764

15882380

4

0

62

30

9

0

60

0

1005900

343406276

37784

16175128

0

0

58

29

13

0

61

0

1005872

343038168

37792

16470724

3

0

62

30

7

0

60

0

1005868

342653976

37792

16747684

1

0

61

30

9

0

116

0

1005836

342343076

37800

17001952

5

0

62

30

8

0

メモ:

表示を簡略化するために、出力の列の一部が削除されました。

上記の表で、id列(アイドル状態である CPU の %を示す)のほとんどが 1 桁であるため、システムが CPU バインドであることがわかります。 これは、53xx の CPU の使用率が常に 90% を超えていることを示します。また、最初の列 r からもシステムが CPU バインドであることを示しています。 列 r の値は 46 から 118 の間で変動します。 r は「CPU でキューを実行する準備ができている」ことを示します。 これは、現在実行しているか、または実行する準備ができていて CPU の解放を待機しているプロセス数です。 53xx には 40 個の論理 CPU スレッドがあり、一度に最大 40 個のプロセスを同時に処理できます。列 r の値から 40 を引くと、実行する準備ができていて CPU サイクルを待機しているプロセスの数を導き出すことができます。

上記の CPU 統計と 120 の同時 98% バックアップストリームを実行している間にこれが発生するという事実によって、CPU の使用率を下げるために 2 つのアクションを実行できます。

  • ジョブのバッチサイズを小さくする。 CPU が過剰にビジー状態である場合は、利用可能な CPU サイクルを待機するため、ジョブに時間がかかりすぎる可能性があります。バッチごとの同時実行ジョブ数を減らすと、全体のパフォーマンスが向上することがあります。

  • フィンガープリントサーバーとして別の 53xx を追加し、CPU 容量を 2 倍にすることは理にかなった解決策です。

追加のフィンガープリントサーバーを使用した簡単な内部実験では、パフォーマンスが約 40% 向上して最大 10 GB/秒となり、アプライアンスの CPU の使用率が 50% 下がることがわかりました。現時点では、53xx は最大 10 x 10 Gbps の NIC をサポートし、ネットワークスループットを約 10 GB/秒に抑えるため、ボトルネックはネットワークになっています。システムに 10 x 10 Gbps を超える NIC をインストールしている場合は、さらにパフォーマンスが向上する可能性があります。