Veritas NetBackup for Hadoop 管理者ガイド

Last Published:
Product(s): NetBackup (8.1.2)
Platform: Linux,UNIX,Windows
  1. 概要
    1.  
      NetBackup を使用した Hadoop データの保護
    2.  
      Hadoop データのバックアップ
    3.  
      Hadoop データのリストア
    4.  
      NetBackup for Hadoop の用語
    5.  
      制限事項
  2. Hadoop プラグインの配備
    1.  
      Hadoop プラグインの配備について
    2. Hadoop プラグインの前提条件
      1.  
        オペレーティングシステムとプラットフォームの互換性
      2.  
        NetBackup サーバーおよびクライアントの要件
      3.  
        NetBackup の Hadoop プラグインのライセンス
    3.  
      Hadoop クラスタの準備
    4.  
      Hadoop プラグインを配備するためのベストプラクティス
    5.  
      Hadoop プラグインの配備の検証
  3. NetBackup for Hadoop の構成
    1.  
      NetBackup for Hadoop の構成について
    2. バックアップホストの管理
      1.  
        NetBackup マスターサーバー上の NetBackup クライアントのホワイトリスト
      2.  
        バックアップホストとしての NetBackup アプライアンスの設定
    3.  
      NetBackup での Hadoop クレデンシャルの追加
    4. Hadoop 構成ファイルを使用した Hadoop プラグインの構成
      1.  
        高可用性 Hadoop クラスタ用の NetBackup の構成
      2.  
        Hadoop クラスタのカスタムポートの設定
      3.  
        バックアップホストのスレッド数の設定
    5.  
      Kerberos を使用する Hadoop クラスタの設定
    6. Hadoop プラグインの NetBackup ポリシーの構成
      1. BigData バックアップポリシーの作成
        1. NetBackup 管理コンソールを使用した BigData ポリシーの作成
          1.  
            Hadoop クラスタの BigData ポリシーを作成するためのポリシーの設定ウィザードの使用
          2.  
            Hadoop クラスタ用の BigData ポリシーを作成するための NetBackup ポリシーユーティリティの使用
        2.  
          Hadoop クラスタ用の BigData ポリシーを作成するための NetBackup コマンドラインインターフェース (CLI) の使用
    7.  
      Hadoop クラスタのディザスタリカバリ
  4. Hadoop のバックアップとリストアの実行
    1. Hadoop クラスタのバックアップについて
      1.  
        Kerberos 認証を使用する Hadoop クラスタのバックアップおよびリストア操作実行の前提条件
      2.  
        Hadoop クラスタのバックアップ
      3.  
        Hadoop クラスタのバックアップを作成するためのベストプラクティス
    2. Hadoop クラスタのリストアについて
      1. 同じ Hadoop クラスタ上での Hadoop データのリストア
        1.  
          同じ Hadoop クラスタに Hadoop データをリストアするためのリストアウィザードの使用
        2.  
          同じ Hadoop クラスタに Hadoop データをリストアするための bprestore コマンドの使用
      2.  
        代替の Hadoop クラスタ上での Hadoop データのリストア
      3.  
        Hadoop クラスタをリストアするためのベストプラクティス
  5. トラブルシューティング
    1.  
      NetBackup for Hadoop の問題のトラブルシューティングについて
    2.  
      NetBackup for Hadoop のデバッグログについて
    3. Hadoop データのバックアップ問題のトラブルシューティング
      1.  
        バックアップ操作がエラー 112 で失敗する
      2.  
        バックアップ操作がエラー 6609 で失敗する
      3.  
        バックアップ操作がエラー 6618 で失敗した
      4.  
        バックアップ操作がエラー 6647 で失敗する
      5.  
        Hadoop で拡張属性 (xattrs) とアクセス制御リスト (ACL) がバックアップまたはリストアされない
      6.  
        バックアップ操作がエラー 6654 で失敗する
      7.  
        バックアップ操作が bpbrm エラー 8857 で失敗する
      8.  
        バックアップ操作がエラー 6617 で失敗する
      9.  
        バックアップ操作がエラー 6616 で失敗する
    4. Hadoop データのリストア問題のトラブルシューティング
      1.  
        リストアが 2850 エラーコードで失敗する
      2.  
        NetBackup の Hadoop のリストアジョブが部分的に完了する
      3.  
        Hadoop で拡張属性 (xattrs) とアクセス制御リスト (ACL) がバックアップまたはリストアされない
      4.  
        Hadoop プラグインファイルがバックアップホスト上にない場合、リストア操作が失敗する
      5.  
        リストアが bpbrm エラー 54932 で失敗する
      6.  
        リストア操作が bpbrm エラー 21296 で失敗する

NetBackup for Hadoop の用語

次の表では、Hadoop クラスタの保護に NetBackup を使用するときに使われる用語を定義しています。

表: NetBackup の用語

用語

定義

複合ジョブ

Hadoop データのバックアップジョブは複合ジョブです。

  • バックアップジョブは、バックアップするデータの情報を取得するための検出ジョブを実行します。

  • 子ジョブは、実際のデータ転送を実行する各バックアップホストに対して作成されます。

  • バックアップが完了すると、ジョブは NameNode 上のスナップショットをクリーンアップし、その後ジョブ自体に完了したというマークが付けられます。

検出ジョブ

バックアップジョブを実行すると、最初に検出ジョブが作成されます。検出ジョブは NameNode と通信し、バックアップする必要があるブロックの情報と、関連する DataNodes の情報を収集します。検出の最後に、ジョブは作業負荷検出ファイルにデータを入力します。ファイルはその後 NetBackup によってバックアップホスト間で作業負荷を分散させるために使用されます。

子ジョブ

バックアップの場合、ストレージメディアにデータを転送するバックアップホストごとに個別の子ジョブが作成されます。子ジョブは、複数の DataNodes からデータブロックを転送できます。

作業負荷検出ファイル

検出時のバックアップホストが NameNode と通信するときに、作業負荷検出ファイルが作成されます。このファイルには、バックアップするデータブロックと、関連付けられている DataNodes についての情報が含まれています。

作業負荷分散ファイル

検出が完了すると、NetBackup はバックアップホストごとに作業負荷配布ファイルを作成します。これらのファイルには、それぞれのバックアップホストで転送されるデータの情報が含まれます。

並列ストリーム

NetBackup 並列ストリーミングフレームワークにより、複数の DataNodes からのデータブロックを、複数のバックアップホストを同時に使用してバックアップできます。

バックアップホスト

バックアップホストは、プロキシクライアントとして機能します。すべてのバックアップとリストア操作は、バックアップホストで実行されます。

メディアサーバー、クライアント、またはマスターサーバーを、バックアップホストとして構成できます。

バックアップホストは、リストア中に宛先クライアントとしても使用されます。

BigData ポリシー

BigData ポリシーは以下を実行するために導入されました。

  • アプリケーションの種類を指定します。

  • 分散マルチノード環境のバックアップを可能にします。

  • バックアップホストを関連付けます。

  • 作業負荷分散を実行します。

アプリケーションサーバー

Namenode は、NetBackup ではアプリケーションサーバーと呼ばれます。

プライマリ NameNode

高可用性シナリオでは、1 つの NameNode を BigData ポリシーと tpconfig コマンドで指定する必要があります。この NameNode はプライマリ NameNode と呼ばれます。

フェールオーバー NameNode

高可用性シナリオでは、hadoop.conf ファイル内で更新されるプライマリ NameNode 以外の NameNode は、フェールオーバー NameNode と呼ばれます。

表: Hadoop の用語

用語

定義

NameNode

NameNode は、リストア中にソースクライアントとしても使用されます。

DataNode

DataNode は、Hadoop で実際のデータを格納する役割を果たします。

スナップショット対応ディレクトリ (スナップショット可能)

スナップショットは、ディレクトリがスナップショット対応になれば、どのディレクトリでも実行できます。

  • 各スナップショット対応ディレクトリは、65,536 の同時スナップショットに対応できます。スナップショット対応ディレクトリの数に制限はありません。

  • 管理者は、どのディレクトリでもスナップショット対応に設定できます。

  • スナップショット対応ディレクトリは、その中にスナップショットがあると、それらすべてのスナップショットが削除されるまでは削除したり名前を変更したりできません。

  • 親または子のいずれかがスナップショット対応ディレクトリである場合、ディレクトリはスナップショット対応にできません。