Veritas NetBackup for Hadoop 管理者ガイド

Last Published:
Product(s): NetBackup (8.1.2)
Platform: Linux,UNIX,Windows
  1. 概要
    1.  
      NetBackup を使用した Hadoop データの保護
    2.  
      Hadoop データのバックアップ
    3.  
      Hadoop データのリストア
    4.  
      NetBackup for Hadoop の用語
    5.  
      制限事項
  2. Hadoop プラグインの配備
    1.  
      Hadoop プラグインの配備について
    2. Hadoop プラグインの前提条件
      1.  
        オペレーティングシステムとプラットフォームの互換性
      2.  
        NetBackup サーバーおよびクライアントの要件
      3.  
        NetBackup の Hadoop プラグインのライセンス
    3.  
      Hadoop クラスタの準備
    4.  
      Hadoop プラグインを配備するためのベストプラクティス
    5.  
      Hadoop プラグインの配備の検証
  3. NetBackup for Hadoop の構成
    1.  
      NetBackup for Hadoop の構成について
    2. バックアップホストの管理
      1.  
        NetBackup マスターサーバー上の NetBackup クライアントのホワイトリスト
      2.  
        バックアップホストとしての NetBackup アプライアンスの設定
    3.  
      NetBackup での Hadoop クレデンシャルの追加
    4. Hadoop 構成ファイルを使用した Hadoop プラグインの構成
      1.  
        高可用性 Hadoop クラスタ用の NetBackup の構成
      2.  
        Hadoop クラスタのカスタムポートの設定
      3.  
        バックアップホストのスレッド数の設定
    5.  
      Kerberos を使用する Hadoop クラスタの設定
    6. Hadoop プラグインの NetBackup ポリシーの構成
      1. BigData バックアップポリシーの作成
        1. NetBackup 管理コンソールを使用した BigData ポリシーの作成
          1.  
            Hadoop クラスタの BigData ポリシーを作成するためのポリシーの設定ウィザードの使用
          2.  
            Hadoop クラスタ用の BigData ポリシーを作成するための NetBackup ポリシーユーティリティの使用
        2.  
          Hadoop クラスタ用の BigData ポリシーを作成するための NetBackup コマンドラインインターフェース (CLI) の使用
    7.  
      Hadoop クラスタのディザスタリカバリ
  4. Hadoop のバックアップとリストアの実行
    1. Hadoop クラスタのバックアップについて
      1.  
        Kerberos 認証を使用する Hadoop クラスタのバックアップおよびリストア操作実行の前提条件
      2.  
        Hadoop クラスタのバックアップ
      3.  
        Hadoop クラスタのバックアップを作成するためのベストプラクティス
    2. Hadoop クラスタのリストアについて
      1. 同じ Hadoop クラスタ上での Hadoop データのリストア
        1.  
          同じ Hadoop クラスタに Hadoop データをリストアするためのリストアウィザードの使用
        2.  
          同じ Hadoop クラスタに Hadoop データをリストアするための bprestore コマンドの使用
      2.  
        代替の Hadoop クラスタ上での Hadoop データのリストア
      3.  
        Hadoop クラスタをリストアするためのベストプラクティス
  5. トラブルシューティング
    1.  
      NetBackup for Hadoop の問題のトラブルシューティングについて
    2.  
      NetBackup for Hadoop のデバッグログについて
    3. Hadoop データのバックアップ問題のトラブルシューティング
      1.  
        バックアップ操作がエラー 112 で失敗する
      2.  
        バックアップ操作がエラー 6609 で失敗する
      3.  
        バックアップ操作がエラー 6618 で失敗した
      4.  
        バックアップ操作がエラー 6647 で失敗する
      5.  
        Hadoop で拡張属性 (xattrs) とアクセス制御リスト (ACL) がバックアップまたはリストアされない
      6.  
        バックアップ操作がエラー 6654 で失敗する
      7.  
        バックアップ操作が bpbrm エラー 8857 で失敗する
      8.  
        バックアップ操作がエラー 6617 で失敗する
      9.  
        バックアップ操作がエラー 6616 で失敗する
    4. Hadoop データのリストア問題のトラブルシューティング
      1.  
        リストアが 2850 エラーコードで失敗する
      2.  
        NetBackup の Hadoop のリストアジョブが部分的に完了する
      3.  
        Hadoop で拡張属性 (xattrs) とアクセス制御リスト (ACL) がバックアップまたはリストアされない
      4.  
        Hadoop プラグインファイルがバックアップホスト上にない場合、リストア操作が失敗する
      5.  
        リストアが bpbrm エラー 54932 で失敗する
      6.  
        リストア操作が bpbrm エラー 21296 で失敗する

Hadoop データのバックアップ

Hadoop データは並列ストリームでバックアップされ、バックアップ時に Hadoop DataNodes はデータブロックを同時に複数のバックアップホストに対してストリームします。

メモ:

Hadoop バックアップ対象で指定されたすべてのディレクトリは、バックアップ前にスナップショット対応に設定しておく必要があります。

次の図は、バックアップフローの概要を示しています。

図: バックアップフロー

バックアップフロー

次の図に示されているようになります。

  1. スケジュールされたバックアップジョブはマスターサーバーからトリガされます。

  2. Hadoop データのバックアップジョブは複合ジョブです。バックアップジョブがトリガされると、最初に検出ジョブが実行されます。

  3. 検出中に、最初のバックアップホストは NameNode と接続し、検出を実行して、バックアップする必要があるデータの詳細を取得します。

  4. 作業負荷検出ファイルは、バックアップホストに作成されます。作業負荷検出ファイルには、さまざまな DataNodes からバックアップする必要があるデータの詳細が含まれています。

  5. バックアップホストは作業負荷検出ファイルを使用し、作業負荷が複数のバックアップホスト間でどのように分散されるかを決定します。作業負荷分散ファイルは、バックアップホストごとに作成されます。

  6. バックアップホストごとに個別の子ジョブが実行されます。作業負荷分散ファイルで指定されたデータがバックアップされます。

  7. データブロックは、異なる DataNodes から複数のバックアップホストに同時にストリームします。

すべての子ジョブが完了するまで、複合バックアップジョブは完了しません。子ジョブが完了すると、NetBackup は NameNode からすべてのスナップショットをクリーンアップします。クリーンアップ活動が完了した後にのみ、複合バックアップジョブは完了します。

Hadoop クラスタのバックアップについてを参照してください。