Veritas NetBackup™ 故障排除指南

Last Published:
Product(s): NetBackup (9.1)
  1. 介绍
    1.  
      NetBackup 日志记录和状态码信息
    2.  
      对问题进行故障排除
    3.  
      用于技术支持的问题报告
    4.  
      关于收集有关 NetBackup-Java 应用程序的信息
  2. 故障排除过程
    1.  
      关于故障排除过程
    2. 对 NetBackup 问题进行故障排除
      1.  
        在 UNIX 服务器上验证是否所有进程正在运行
      2.  
        在 Windows 服务器上验证是否所有进程正在运行
    3.  
      对安装问题进行故障排除
    4.  
      对配置问题进行故障排除
    5.  
      设备配置问题解决方法
    6.  
      测试主服务器和客户端
    7.  
      测试介质服务器和客户端
    8.  
      解决与 UNIX 客户端相关的网络通信问题
    9.  
      解决与 Windows 客户端相关的网络通信问题
    10. vnetd 代理连接故障排除
      1.  
        vnetd 代理连接要求
      2.  
        从何着手对 vnetd 代理连接进行故障排除
      3.  
        验证 vnetd 进程及其代理是否处于活动状态
      4.  
        验证主机连接是否已设置代理
      5.  
        测试 vnetd 代理连接
      6.  
        检查连接和接受进程的日志文件
      7.  
        查看 vnetd 代理日志文件
    11. 安全证书吊销故障排除
      1.  
        对云提供商的已吊销 SSL 证书问题进行故障排除
      2.  
        对云提供商的 CRL 下载问题进行故障排除
      3.  
        主机的 CRL 如何影响证书吊销故障排除
      4.  
        NetBackup 作业因证书已被吊销或 CRL 不可用而失败
      5.  
        NetBackup 作业由于明显的网络错误而失败
      6.  
        NetBackup 作业由于资源不可用而失败
      7.  
        主服务器安全证书已吊销
      8.  
        确定 NetBackup 主机的证书状态
      9.  
        外部 CA 签名证书吊销问题故障排除
    12.  
      关于网络和主机名故障排除
    13. 验证 NetBackup 中的主机名和服务条目
      1.  
        UNIX 主服务器和客户端上主机名和服务条目的示例
      2.  
        UNIX 主服务器和介质服务器上主机名和服务条目的示例
      3.  
        UNIX PC 客户端上主机名和服务条目的示例
      4.  
        连接到多个网络的 UNIX 服务器上主机名和服务条目的示例
    14.  
      关于 bpclntcmd 实用程序
    15.  
      使用“主机属性”窗口访问配置设置
    16.  
      解决磁盘已满的问题
    17. 冻结的介质故障排除注意事项
      1.  
        对冻结的介质进行故障排除时可参考的日志
      2.  
        关于导致介质冻结的情况
    18. 对 NetBackup Web 服务问题进行故障排除
      1.  
        查看 NetBackup Web 服务日志
      2.  
        配置外部 CA 后的 Web 服务问题故障排除
    19.  
      对 NetBackup Web 服务器证书问题进行故障排除
    20. 解决 PBX 问题
      1.  
        检查 PBX 安装
      2.  
        检查 PBX 是否正在运行
      3.  
        检查 PBX 是否已正确设置
      4.  
        访问 PBX 日志
      5.  
        对 PBX 安全性进行故障排除
      6.  
        确定 PBX 后台驻留程序或服务是否可用
    21. 远程主机验证问题故障排除
      1.  
        查看与主机验证相关的日志
      2.  
        启用与 NetBackup 8.0 和更低版本主机的不安全通信
      3.  
        批准待定的主机 ID-主机名映射
      4.  
        清除主机缓存
    22. 自动映像复制故障排除
      1.  
        与自动映像复制和 SLP 一起使用的主服务器的规则
      2. 使用外部证书配置时,目标 AIR 可信主服务器操作失败
        1.  
          添加或更新信任关系
        2.  
          删除信任关系
      3.  
        关于对 SLP 组件管理的自动导入作业进行故障排除
    23.  
      对网络接口卡性能进行故障排除
    24.  
      关于 bp.conf 文件中的 SERVER 条目
    25.  
      关于存储单元不可用的问题
    26.  
      解决 Windows 上的 NetBackup 管理操作失败
    27.  
      在 UNIX 计算机上解析 NetBackup 管理控制台中显示的乱码文本
    28.  
      对 NetBackup 管理控制台中的错误消息进行故障排除
    29.  
      “NetBackup 管理控制台”需要有额外的磁盘空间来存储日志和临时文件
    30.  
      在配置外部 CA 后,无法登录 NetBackup 管理控制台
    31.  
      基于文件的外部证书问题故障排除
    32.  
      Windows 证书存储库问题故障排除
    33.  
      备份失败故障排除
    34.  
      对 NAT 客户端或 NAT 服务器的备份失败问题进行故障排除
    35.  
      对 NetBackup Messaging Broker(或 nbmqbroker)服务问题进行故障排除
    36.  
      Windows 系统的电子邮件通知出现问题
    37.  
      KMS 配置问题
    38.  
      由于密钥较大而导致启动 NetBackup CA 迁移时出现的问题
    39.  
      非特权用户(服务用户)帐户的相关问题
    40.  
      auth.conf 文件中的组名称格式问题
  3. 使用 NetBackup 实用程序
    1.  
      关于 NetBackup 故障排除实用程序
    2.  
      关于 NetBackup 调试日志分析实用程序
    3.  
      关于日志记录助理
    4.  
      关于网络故障排除实用程序
    5. 关于 NetBackup 支持实用程序 (nbsu)
      1.  
        NetBackup 支持实用程序 (nbsu) 的输出
      2.  
        NetBackup 支持实用程序 (nbsu) 的进度显示示例
    6. 关于 NetBackup 一致性检查实用程序 (NBCC)
      1.  
        NetBackup 一致性检查实用程序 (NBCC) 的输出
      2.  
        NBCC 进度显示的示例
    7.  
      关于 NetBackup 一致性检查修复 (NBCC) 实用程序
    8.  
      关于 nbcplogs 实用程序
    9. 关于机械手测试实用程序
      1.  
        在 UNIX 环境下进行机械手测试
      2.  
        在 Windows 环境下进行机械手测试
    10. 关于 NetBackup 智能诊断 (nbsmartdiag) 实用程序
      1.  
        使用 nbsmartdiag 实用程序进行 NetBackup 主机通信的工作流程
  4. 灾难恢复
    1.  
      关于灾难恢复
    2.  
      关于灾难恢复要求
    3.  
      灾难恢复软件包
    4.  
      关于灾难恢复设置
    5.  
      推荐的备份方法
    6. 关于适用于 UNIX 和 Linux 的磁盘恢复过程
      1. 关于恢复 UNIX 和 Linux 的主服务器磁盘
        1.  
          在根文件系统完好无损的情况下恢复主服务器
        2.  
          在根分区丢失的情况下恢复主服务器
      2.  
        关于恢复 UNIX 的 NetBackup 介质服务器磁盘
      3.  
        在 UNIX 客户端工作站上恢复系统磁盘
    7. 关于 UNIX 和 Linux 上的群集 NetBackup 服务器恢复
      1.  
        替换 UNIX 或 Linux 群集上的故障节点
      2.  
        恢复整个 UNIX 或 Linux 群集
    8. 关于适用于 Windows 的磁盘恢复过程
      1. 关于恢复 Windows 的主服务器磁盘
        1.  
          在 Windows 完好无损的情况下恢复主服务器
        2.  
          恢复主服务器和 Windows
      2.  
        关于恢复 Windows 的 NetBackup 介质服务器磁盘
      3.  
        恢复 Windows 客户端磁盘
    9. 关于 Windows 上的群集 NetBackup 服务器恢复
      1.  
        替换 Windows VCS 群集上的故障节点
      2.  
        恢复 Windows VCS 群集上的共享磁盘
      3.  
        恢复整个 Windows VCS 群集
    10.  
      灾难恢复安装后在群集主服务器上生成证书
    11.  
      关于还原灾难恢复软件包
    12.  
      关于 DR_PKG_MARKER_FILE 环境变量
    13.  
      在 Windows 上还原灾难恢复软件包
    14.  
      在 UNIX 上还原灾难恢复软件包
    15. 关于恢复 NetBackup 目录库
      1.  
        关于在 Windows 计算机上执行 NetBackup 目录库恢复
      2.  
        关于从磁盘设备执行 NetBackup 目录库恢复
      3.  
        关于 NetBackup 目录库恢复和符号链接
      4. 关于 NetBackup 目录库恢复和 OpsCenter
        1.  
          在目录库恢复之后指定 NetBackup 作业 ID 编号
      5.  
        NetBackup 灾难恢复电子邮件示例
      6. 关于恢复整个 NetBackup 目录库
        1.  
          使用目录库恢复向导恢复整个 NetBackup 目录库
        2.  
          使用 bprecover -wizard 恢复整个 NetBackup 目录库
      7.  
        在目录库恢复之前建立与 NAT 介质服务器的连接
      8. 关于恢复 NetBackup 目录库映像文件
        1.  
          使用目录库恢复向导恢复 NetBackup 目录库映像文件
        2.  
          使用 bprecover -wizard 恢复 NetBackup 目录库映像文件
      9. 关于恢复 NetBackup 关系数据库
        1.  
          从备份恢复 NetBackup 关系数据库文件
        2.  
          从分段作业恢复 NetBackup 关系数据库文件
        3.  
          关于在分段作业中处理关系数据库
      10.  
        在配置 NetBackup Access Control 时恢复 NetBackup 目录库
      11.  
        从目录库备份的非主副本恢复 NetBackup 目录库
      12.  
        不使用灾难恢复文件恢复 NetBackup 目录库
      13.  
        从命令行恢复 NetBackup 用户控制的联机目录库备份
      14.  
        从 NetBackup 联机目录库备份还原文件
      15.  
        取消冻结 NetBackup 联机目录库恢复介质
      16.  
        在目录库恢复期间出现退出状态 5988 时要执行的步骤
  5.  
    索引

测试主服务器和客户端

如果 NetBackup、安装和配置故障排除过程无法查明问题所在,请执行下列过程。跳过您已经执行的步骤。

这些过程假设已经成功安装了软件,但是配置不一定正确。如果 NetBackup 始终无法正常工作,则很可能是配置问题。尤其要寻找设备配置问题。

也许还需要将每个备份和还原执行两次。在 UNIX 上,可先以 root 用户身份执行一次,然后再以非 root 用户身份执行一次。如果是 Windows 系统,请首先以管理员组的成员身份执行这些检查。然后再以非管理员组的成员身份执行。无论哪种情况,都要确保对测试文件具有读写权限。

这些过程中的说明假定您熟悉备份进程和还原进程。有关更多信息,请参见《NetBackup 日志记录参考指南》。

此过程中有几个步骤提到了“所有日志条目”报告。要获取有关此报告及其他内容的更多信息,请参考:

请参见 NetBackup 管理指南,第 I 卷

表:主服务器和客户端的测试步骤

步骤

操作

描述

步骤 1

启用调试日志。

启用主服务器上相应的调试日志。

有关日志记录的信息,请参见《NetBackup 日志记录参考指南》。

如果不知道应该应用哪些日志,可启用所有日志,直到问题解决为止。问题解决后,应删除这些调试日志目录。

步骤 2

配置测试策略。

配置一个测试策略以使用基本磁盘存储单元。

或者,配置一个测试策略并在测试过程中将备份时段设置为打开。将主服务器指定为客户端并指定一个位于该主服务器上的存储单元(最好是一个非机械手驱动器)。然后,在 NetBackup 卷池中配置一个卷,并将该卷插入到驱动器中。如果未使用 bplabel 命令标记此卷,NetBackup 将自动为其分配一个以前未使用过的介质 ID。

步骤 3

验证后台驻留程序和服务。

要验证 NetBackup 后台驻留程序或服务是否正在主服务器上运行,请执行以下操作:

  • 要检查 UNIX 系统上的后台驻留程序,请输入以下命令:

    /usr/openv/netbackup/bin/bpps -x
  • 要检查 Windows 系统上的服务,可使用 NetBackup 活动监视器或者 Windows“控制面板”的“服务”应用程序。

步骤 4

备份和还原一个策略。

使用 NetBackup 管理界面中的手动备份选项,启动一个策略的手动备份。然后,还原该备份。

这些操作将验证以下内容:

  • NetBackup 服务器软件(包括所有的后台驻留程序或服务、程序及数据库)正常工作。

  • NetBackup 可以装入介质,并使用您配置的驱动器。

步骤 5

检查故障。

如果出现故障,请在“活动监视器”中检查作业的“详细状态”

也可以尝试检查 NetBackup 的“所有日志条目”报告。对于有关驱动器或介质的故障,请确保该驱动器处于“启动”状态并且该硬件运行正常。

要进一步查明问题,可使用调试日志。

有关处理顺序的概述,请参见《NetBackup 日志记录参考指南》中有关备份进程和还原进程的信息。

步骤 6

查阅调试日志以外的相关信息。

如果调试日志不能揭示问题,可检查以下内容:

  • UNIX 系统上的系统日志

  • Windows 系统上的事件查看器日志和系统日志

  • 执行了备份、还原或复制的介质服务器上的介质管理器调试日志

  • 执行了备份、还原或复制的介质服务器上的 bpdmbptm 调试日志

有关硬件故障的信息,请参见供应商手册。

步骤 7

验证机械手驱动器。

如果您使用的是机械手并且这是初始配置,请确保机械手驱动器的配置是正确的。

尤其要验证以下内容:

  • 在介质和设备管理以及存储单元配置中使用相同的机械手编号。

  • 每个机械手都具有唯一的机械手编号。

在 UNIX NetBackup 服务器上,您可以仅验证配置的介质和设备管理部分。要进行验证,请使用 tpreq 命令来请求装入介质。确保安装已完成并检查介质装到了哪个驱动器上。重复执行这一过程,直到在发生问题的主机的每一个驱动器上都装入并卸载了介质。如果可以顺利执行以上操作,那么问题可能出在策略或存储单元配置上。此操作完成后,使用 tpunmount 命令卸载介质。

步骤 8

将机械手纳入测试策略。

如果您以前配置了一个非机械手驱动器,而您的系统包含机械手,则现在可以更改测试策略,以指定一个机械手,并向该机械手添加一个卷。此卷必须位于该机械手 EMM 数据库主机上的 NetBackup 卷池中。

返回到步骤 3 并对机械手重复此过程。此过程将确保 NetBackup 可以找到卷、装入卷并使用机械手驱动器。

步骤 9

使用机械手测试实用程序。

如果启动存在问题,请尝试测试实用程序。

在备份或还原处于活动状态时,不要使用机械手测试实用程序。这些实用程序会阻止相应的机械手进程执行机械手操作(如加载和卸载介质)。结果就会造成介质装入超时,且无法执行其他机械手操作(如机械手清点和弹入或弹出)。

步骤 10

完善测试策略。

向测试策略添加一个用户日程表(在测试过程中备份时段必须打开)。使用在以前的步骤中已验证过的存储单元和介质。

步骤 11

备份和还原一个文件。

通过使用主服务器上的客户端用户界面,启动某个文件的用户备份和还原。监视该操作的状态和进度日志。如果成功,则此操作可确定主服务器上的客户端软件功能正常。

如果出现故障,请检查 NetBackup 的“所有日志条目”报告。要进一步查明问题,可在下面的列表中查看相应的调试日志。

在 UNIX 系统上,这些调试日志位于 /usr/openv/netbackup/logs/ 目录中。在 Windows 计算机上,调试日志位于 install_path\NetBackup\logs\ 目录中。

下列进程具有调试日志目录:

  • bparchive(仅限 UNIX)

  • bpbackup(仅限 UNIX)

  • bpbkar

  • bpcd

  • bplist

  • bprd

  • bprestore

  • nbwin(仅限 Windows)

  • bpinetd(仅限 Windows)

本文档提供了有关特定客户端类型适用哪些日志的说明。

有关日志记录的信息,请参见《NetBackup 日志记录参考指南》

步骤 12

重新配置测试策略。

重新配置您的测试策略,指定一个位于网络中其他位置的客户端。使用在以前的步骤中已验证过的存储单元和介质。如有必要,可安装 NetBackup 客户端软件。

步骤 13

创建调试日志目录。

为下列进程创建调试日志目录:

  • 服务器上的 bprd

  • 客户端上的 bpcd

  • 客户端上的 bpbkar

  • 客户端上的 nbwin(仅限 Windows)

  • 客户端上的 bpbackup(Windows 客户端除外)

  • bpinetd(仅限 Windows)

  • tar

  • 介质服务器上的 bpbrmbpdmbptm

本文档提供了有关特定客户端类型适用哪些日志的说明。

有关日志记录的信息,请参见《NetBackup 日志记录参考指南》

步骤 14

验证客户端与主服务器之间的通信。

从步骤 8 中指定的客户端执行一个用户备份,然后进行还原。这些操作可验证客户端与主服务器之间以及与客户端上的 NetBackup 软件之间的通信。

如果出现错误,请在“活动监视器”中检查作业的“详细状态”

请查看“所有日志条目”报告和在上一步中创建的调试日志。造成错误的原因可能是服务器与客户端之间的通信问题。

步骤 15

测试其他客户端或存储单元。

如果测试策略的运行效果令人满意,请根据需要重复特定的步骤,来检查其他客户端和存储单元。

步骤 16

测试其余策略和日程表。

如果所有的客户端和存储单元都功能正常,可测试使用主服务器上的存储单元的其余策略和日程表。如果预定备份失败,请查看“所有日志条目”报告以找出错误。然后,执行错误状态码中所指示的建议操作。