Veritas NetBackup for Hadoop 管理者ガイド
- 概要
- Hadoop プラグインの配備
- NetBackup for Hadoop の構成
- Hadoop のバックアップとリストアの実行
- トラブルシューティング
NetBackup を使用した Hadoop データの保護
NetBackup の並列ストリームフレームワーク (PSF) を使用した場合、NetBackup を使用して Hadoop データを保護できるようになりました。
次の図は、NetBackup によって Hadoop データを保護する方法の概要を示しています。
用語の定義も確認してください。NetBackup for Hadoop の用語を参照してください。
図では次の内容を説明しています。
データは並列ストリームでバックアップされ、バックアップ時に DataNodes はデータブロックを同時に複数のバックアップホストに対してストリームします。ジョブの処理速度が、複数のバックアップホストと並列ストリームによって向上します。
Hadoop クラスタと NetBackup 間の通信は、Hadoop の NetBackup プラグインを使用して有効になります。
プラグインは NetBackup のインストール時にインストールされます。
NetBackup 通信の場合、BigData ポリシーを構成し、関連するバックアップホストを追加する必要があります。
NetBackup のメディアサーバー、クライアント、またはマスターサーバーをバックアップホストとして構成することができます。また、DataNodes の数によっては、バックアップホストを追加または削除することができます。バックアップホストをさらに追加することによって使用環境の規模を簡単に拡大することができます。
NetBackup 並列ストリームフレームワークにより、エージェントレスのバックアップが可能で、バックアップとリストア操作はバックアップホストで実行します。クラスタノードには、エージェントの占有域がありません。また、NetBackup は Hadoop クラスタのアップグレードやメンテナンスの影響を受けません。
詳細情報:
Hadoop データのバックアップを参照してください。
Hadoop データのリストアを参照してください。
制限事項を参照してください。
NetBackup 並列ストリームフレームワーク (PSF) については、『NetBackup 管理者ガイド Vol. 1』を参照してください。