NetBackup™ Web UI Kubernetes 管理者ガイド

Last Published:
Product(s): NetBackup (10.1.1)
  1. NetBackup for Kubernetes の概要
    1.  
      概要
    2.  
      Kubernetes 用の NetBackup サポート機能
  2. NetBackup Kubernetes Operator の配備と構成
    1.  
      NetBackup Kubernetes Operator でのサービスパッケージの配備
    2.  
      Kubernetes Operator の配備のためのポート要件
    3.  
      NetBackup Kubernetes Operator のアップグレード
    4.  
      NetBackup Kubernetes Operator の削除
    5.  
      NetBackup Kubernetes datamover の構成
    6. NetBackup スナップショット操作の設定を行う
      1.  
        Kubernetes Operator でサポートされる構成パラメータ
      2.  
        スナップショットからのバックアップ操作とバックアップからのリストア操作の前提条件
      3.  
        Kubernetes でサポートされる DTE クライアント設定
      4.  
        datamover プロパティのカスタマイズ
    7.  
      短縮名の付いた NetBackup サーバーのトラブルシューティング
  3. イメージグループの管理
    1. イメージグループについて
      1.  
        イメージの期限切れ
      2.  
        イメージのコピー
  4. NetBackup Kubernetes Operator での証明書の配備
    1.  
      Kubernetes Operator での証明書の配備
    2.  
      ホスト ID ベースの証明書操作の実行
    3.  
      ECA 証明書操作の実行
    4.  
      証明書の種類の識別
  5. Kubernetes 資産の管理
    1.  
      Kubernetes クラスタの追加
    2. 設定を行う
      1.  
        リソース制限の設定を行う
      2.  
        自動検出の間隔の構成
      3.  
        権限の構成
    3.  
      資産への保護の追加
    4.  
      FileMode ボリュームのサポート
  6. Kubernetes インテリジェントグループの管理
    1.  
      インテリジェントグループについて
    2.  
      インテリジェントグループの作成
    3.  
      インテリジェントグループの削除
    4.  
      インテリジェントグループの編集
  7. Kubernetes 資産の保護
    1.  
      インテリジェントグループの保護
    2.  
      インテリジェントグループからの保護の削除
    3.  
      バックアップスケジュールの構成
    4.  
      バックアップオプションの構成
    5.  
      バックアップの構成
    6.  
      自動イメージレプリケーション (AIR) と複製の構成
    7.  
      ストレージユニットの構成
    8.  
      FileMode ボリュームのサポート
  8. Kubernetes 資産のリカバリ
    1.  
      リカバリポイントの検索と検証
    2.  
      スナップショットからのリストア
    3.  
      バックアップコピーからのリストア
  9. Kubernetes の問題のトラブルシューティング
    1.  
      プライマリサーバーのアップグレード時のエラー: NBCheck が失敗する
    2.  
      古いイメージのリストア時のエラー: 操作が失敗する
    3.  
      永続ボリュームのリカバリ API でのエラー
    4.  
      リストア中のエラー: ジョブの最終状態で一部が失敗していると表示される
    5.  
      同じ名前空間でのリストア時のエラー
    6.  
      datamover ポッドが Kubernetes のリソース制限を超過
    7.  
      リストア時のエラー: 高負荷のクラスタでジョブが失敗する
    8.  
      特定のクラスタ用に作成されたカスタムの Kubernetes の役割でジョブを表示できない
    9.  
      OperatorHub からインストールされたアプリケーションのリストア時に、選択されていない空の PVC が Openshift によって作成される
    10.  
      OperatorHub からインストールされたアプリケーションのリストア時に、選択されていない空の PVC が Openshift によって作成される
    11.  
      Kubernetes ノードで PID の制限を超えると NetBackup Kubernetes Operator が応答しなくなる
    12.  
      NetBackup Kubernetes 10.1 におけるクラスタの編集中のエラー
    13.  
      大きいサイズの PVC でスナップショットからのリストアが失敗する
    14.  
      名前空間ファイルモードの PVC を別のファイルシステムにリストアすると部分的に失敗する
    15.  
      バックアップコピーからのリストアがイメージの不整合エラーで失敗する

Kubernetes ノードで PID の制限を超えると NetBackup Kubernetes Operator が応答しなくなる

Linux システムでは、ゾンビプロセスを消去するために PID 1 として実行される initd またはシステムプロセスが存在します。そのような initd プロセスを持たないコンテナでは、ゾンビプロセスが生成され続けます。

一定の期間が経過すると、このようなゾンビプロセスが蓄積され、Kubernetes ノードで設定されている PID の上限に達します。

NetBackup Kubernetes Operator では、nbcertcmdtool が証明書関連の操作を実行するために子プロセスを生成します。操作が完了すると、プロセスは孤立し、消去されません。最終的に PID の上限に達し、NetBackup Kubernetes Operator は応答しなくなります。

Error message: login pod/nbukops-controller-manager-67f5498bbb-gn9zw -c netbackupkops -n nbukops ERRO[0005] exec failed: container_linux.go:380: starting container process caused: read init-p: connection reset by peer a command that is terminated with exit code 1.

推奨処置:

  • PID の上限の超過の問題を解決するには、Initd スクリプトを使用します。Initd スクリプトは、コントローラポッドの親プロセスまたはエントリポイントスクリプトとして機能します。

    親プロセスは、子プロセスの完了後にゾンビプロセスを自分自身に接続し、永続的なゾンビプロセスを終了させます。また、コンテナを正常にシャットダウンするためにも役立ちます。Initd スクリプトは、NBUKOPs ビルドバージョン 10.0.1 で利用可能です。

  • 既存の nbcertcmdtool ゾンビプロセスを削除するには、次の手順を実行します。

  1. NetBackup オペレータポッドを記述し、コントローラポッドが実行されている Kubernetes ノードを見つけます。次のコマンドを実行します。

    kubectl describe -c netbackupkops <NB k8s operator pod name> -n <namespace>

  2. 次のコマンドを実行し、Kubernetes ノードにログオンします。

    kubectl debug node/nodename

  3. 次のコマンドを実行し、nbcertcmdtool ゾンビプロセスを終了します。

    ps -ef | grep "\[nbcertcmdtool\] <defunct>" | awk '{print $3}' | xargs kill -9

メモ:

これらの手順により、そのワーカーノードのすべてのゾンビプロセスが終了します。ただし、この問題の解決は一時的です。永続的な解決策としては、Initd スクリプトを使用して新しい KOps ビルドを配備する必要があります。