Veritas NetBackup™ 故障排除指南

Last Published:
Product(s): NetBackup (9.1)
  1. 介绍
    1.  
      NetBackup 日志记录和状态码信息
    2.  
      对问题进行故障排除
    3.  
      用于技术支持的问题报告
    4.  
      关于收集有关 NetBackup-Java 应用程序的信息
  2. 故障排除过程
    1.  
      关于故障排除过程
    2. 对 NetBackup 问题进行故障排除
      1.  
        在 UNIX 服务器上验证是否所有进程正在运行
      2.  
        在 Windows 服务器上验证是否所有进程正在运行
    3.  
      对安装问题进行故障排除
    4.  
      对配置问题进行故障排除
    5.  
      设备配置问题解决方法
    6.  
      测试主服务器和客户端
    7.  
      测试介质服务器和客户端
    8.  
      解决与 UNIX 客户端相关的网络通信问题
    9.  
      解决与 Windows 客户端相关的网络通信问题
    10. vnetd 代理连接故障排除
      1.  
        vnetd 代理连接要求
      2.  
        从何着手对 vnetd 代理连接进行故障排除
      3.  
        验证 vnetd 进程及其代理是否处于活动状态
      4.  
        验证主机连接是否已设置代理
      5.  
        测试 vnetd 代理连接
      6.  
        检查连接和接受进程的日志文件
      7.  
        查看 vnetd 代理日志文件
    11. 安全证书吊销故障排除
      1.  
        对云提供商的已吊销 SSL 证书问题进行故障排除
      2.  
        对云提供商的 CRL 下载问题进行故障排除
      3.  
        主机的 CRL 如何影响证书吊销故障排除
      4.  
        NetBackup 作业因证书已被吊销或 CRL 不可用而失败
      5.  
        NetBackup 作业由于明显的网络错误而失败
      6.  
        NetBackup 作业由于资源不可用而失败
      7.  
        主服务器安全证书已吊销
      8.  
        确定 NetBackup 主机的证书状态
      9.  
        外部 CA 签名证书吊销问题故障排除
    12.  
      关于网络和主机名故障排除
    13. 验证 NetBackup 中的主机名和服务条目
      1.  
        UNIX 主服务器和客户端上主机名和服务条目的示例
      2.  
        UNIX 主服务器和介质服务器上主机名和服务条目的示例
      3.  
        UNIX PC 客户端上主机名和服务条目的示例
      4.  
        连接到多个网络的 UNIX 服务器上主机名和服务条目的示例
    14.  
      关于 bpclntcmd 实用程序
    15.  
      使用“主机属性”窗口访问配置设置
    16.  
      解决磁盘已满的问题
    17. 冻结的介质故障排除注意事项
      1.  
        对冻结的介质进行故障排除时可参考的日志
      2.  
        关于导致介质冻结的情况
    18. 对 NetBackup Web 服务问题进行故障排除
      1.  
        查看 NetBackup Web 服务日志
      2.  
        配置外部 CA 后的 Web 服务问题故障排除
    19.  
      对 NetBackup Web 服务器证书问题进行故障排除
    20. 解决 PBX 问题
      1.  
        检查 PBX 安装
      2.  
        检查 PBX 是否正在运行
      3.  
        检查 PBX 是否已正确设置
      4.  
        访问 PBX 日志
      5.  
        对 PBX 安全性进行故障排除
      6.  
        确定 PBX 后台驻留程序或服务是否可用
    21. 远程主机验证问题故障排除
      1.  
        查看与主机验证相关的日志
      2.  
        启用与 NetBackup 8.0 和更低版本主机的不安全通信
      3.  
        批准待定的主机 ID-主机名映射
      4.  
        清除主机缓存
    22. 自动映像复制故障排除
      1.  
        与自动映像复制和 SLP 一起使用的主服务器的规则
      2. 使用外部证书配置时,目标 AIR 可信主服务器操作失败
        1.  
          添加或更新信任关系
        2.  
          删除信任关系
      3.  
        关于对 SLP 组件管理的自动导入作业进行故障排除
    23.  
      对网络接口卡性能进行故障排除
    24.  
      关于 bp.conf 文件中的 SERVER 条目
    25.  
      关于存储单元不可用的问题
    26.  
      解决 Windows 上的 NetBackup 管理操作失败
    27.  
      在 UNIX 计算机上解析 NetBackup 管理控制台中显示的乱码文本
    28.  
      对 NetBackup 管理控制台中的错误消息进行故障排除
    29.  
      “NetBackup 管理控制台”需要有额外的磁盘空间来存储日志和临时文件
    30.  
      在配置外部 CA 后,无法登录 NetBackup 管理控制台
    31.  
      基于文件的外部证书问题故障排除
    32.  
      Windows 证书存储库问题故障排除
    33.  
      备份失败故障排除
    34.  
      对 NAT 客户端或 NAT 服务器的备份失败问题进行故障排除
    35.  
      对 NetBackup Messaging Broker(或 nbmqbroker)服务问题进行故障排除
    36.  
      Windows 系统的电子邮件通知出现问题
    37.  
      KMS 配置问题
    38.  
      由于密钥较大而导致启动 NetBackup CA 迁移时出现的问题
    39.  
      非特权用户(服务用户)帐户的相关问题
    40.  
      auth.conf 文件中的组名称格式问题
  3. 使用 NetBackup 实用程序
    1.  
      关于 NetBackup 故障排除实用程序
    2.  
      关于 NetBackup 调试日志分析实用程序
    3.  
      关于日志记录助理
    4.  
      关于网络故障排除实用程序
    5. 关于 NetBackup 支持实用程序 (nbsu)
      1.  
        NetBackup 支持实用程序 (nbsu) 的输出
      2.  
        NetBackup 支持实用程序 (nbsu) 的进度显示示例
    6. 关于 NetBackup 一致性检查实用程序 (NBCC)
      1.  
        NetBackup 一致性检查实用程序 (NBCC) 的输出
      2.  
        NBCC 进度显示的示例
    7.  
      关于 NetBackup 一致性检查修复 (NBCC) 实用程序
    8.  
      关于 nbcplogs 实用程序
    9. 关于机械手测试实用程序
      1.  
        在 UNIX 环境下进行机械手测试
      2.  
        在 Windows 环境下进行机械手测试
    10. 关于 NetBackup 智能诊断 (nbsmartdiag) 实用程序
      1.  
        使用 nbsmartdiag 实用程序进行 NetBackup 主机通信的工作流程
  4. 灾难恢复
    1.  
      关于灾难恢复
    2.  
      关于灾难恢复要求
    3.  
      灾难恢复软件包
    4.  
      关于灾难恢复设置
    5.  
      推荐的备份方法
    6. 关于适用于 UNIX 和 Linux 的磁盘恢复过程
      1. 关于恢复 UNIX 和 Linux 的主服务器磁盘
        1.  
          在根文件系统完好无损的情况下恢复主服务器
        2.  
          在根分区丢失的情况下恢复主服务器
      2.  
        关于恢复 UNIX 的 NetBackup 介质服务器磁盘
      3.  
        在 UNIX 客户端工作站上恢复系统磁盘
    7. 关于 UNIX 和 Linux 上的群集 NetBackup 服务器恢复
      1.  
        替换 UNIX 或 Linux 群集上的故障节点
      2.  
        恢复整个 UNIX 或 Linux 群集
    8. 关于适用于 Windows 的磁盘恢复过程
      1. 关于恢复 Windows 的主服务器磁盘
        1.  
          在 Windows 完好无损的情况下恢复主服务器
        2.  
          恢复主服务器和 Windows
      2.  
        关于恢复 Windows 的 NetBackup 介质服务器磁盘
      3.  
        恢复 Windows 客户端磁盘
    9. 关于 Windows 上的群集 NetBackup 服务器恢复
      1.  
        替换 Windows VCS 群集上的故障节点
      2.  
        恢复 Windows VCS 群集上的共享磁盘
      3.  
        恢复整个 Windows VCS 群集
    10.  
      灾难恢复安装后在群集主服务器上生成证书
    11.  
      关于还原灾难恢复软件包
    12.  
      关于 DR_PKG_MARKER_FILE 环境变量
    13.  
      在 Windows 上还原灾难恢复软件包
    14.  
      在 UNIX 上还原灾难恢复软件包
    15. 关于恢复 NetBackup 目录库
      1.  
        关于在 Windows 计算机上执行 NetBackup 目录库恢复
      2.  
        关于从磁盘设备执行 NetBackup 目录库恢复
      3.  
        关于 NetBackup 目录库恢复和符号链接
      4. 关于 NetBackup 目录库恢复和 OpsCenter
        1.  
          在目录库恢复之后指定 NetBackup 作业 ID 编号
      5.  
        NetBackup 灾难恢复电子邮件示例
      6. 关于恢复整个 NetBackup 目录库
        1.  
          使用目录库恢复向导恢复整个 NetBackup 目录库
        2.  
          使用 bprecover -wizard 恢复整个 NetBackup 目录库
      7.  
        在目录库恢复之前建立与 NAT 介质服务器的连接
      8. 关于恢复 NetBackup 目录库映像文件
        1.  
          使用目录库恢复向导恢复 NetBackup 目录库映像文件
        2.  
          使用 bprecover -wizard 恢复 NetBackup 目录库映像文件
      9. 关于恢复 NetBackup 关系数据库
        1.  
          从备份恢复 NetBackup 关系数据库文件
        2.  
          从分段作业恢复 NetBackup 关系数据库文件
        3.  
          关于在分段作业中处理关系数据库
      10.  
        在配置 NetBackup Access Control 时恢复 NetBackup 目录库
      11.  
        从目录库备份的非主副本恢复 NetBackup 目录库
      12.  
        不使用灾难恢复文件恢复 NetBackup 目录库
      13.  
        从命令行恢复 NetBackup 用户控制的联机目录库备份
      14.  
        从 NetBackup 联机目录库备份还原文件
      15.  
        取消冻结 NetBackup 联机目录库恢复介质
      16.  
        在目录库恢复期间出现退出状态 5988 时要执行的步骤
  5.  
    索引

解决与 UNIX 客户端相关的网络通信问题

以下过程用于解决 NetBackup 通信问题,如与 NetBackup 状态码 25、54、57 和 58 相关联的问题。此过程包含两种情况:一个针对 UNIX 客户端,另一个针对 Windows 客户端。

注意:

无论哪种情况,都要首先确保网络配置在 NetBackup 之外工作正常,然后再尝试解决 NetBackup 问题。

对于 UNIX 客户端,执行下列步骤。在启动此过程之前,请在 /usr/openv/netbackup/bp.conf 文件中添加 VERBOSE=5 选项。

表:解决与 UNIX 客户端相关的网络通信问题的步骤

步骤

操作

描述

步骤 1

创建调试日志目录。

在通信重试过程中,调试日志将提供详细的调试信息,以帮助您分析问题。

创建下列目录:

  • bpcd(在主服务器和客户端上)

  • vnetd(在主服务器和客户端上)

  • bprd(在主服务器上)

使用 bprd 日志目录调试客户端与主服务器的通信问题,而不是客户端与介质服务器的通信问题。

步骤 2

测试新配置或修改过的配置。

如果此配置是一个新配置或修改过的配置,请执行以下操作:

  • 检查最近所做的全部修改,并确保问题不是由这些修改引起的。

  • 确保客户端软件已安装且它支持客户端操作系统。

  • 检查 NetBackup 配置中的客户端名、服务器名和服务条目,详见以下主题:

    请参见验证 NetBackup 中的主机名和服务条目

    您还可以在客户端上使用 hostname 命令来确定客户端将请求发送到主服务器所用的主机名。检查主服务器上的 bprd 调试日志,确定当该服务器接收请求时发生的操作。

步骤 3

验证名称解析。

要验证名称解析,请在主服务器和介质服务器上运行下列命令:

# bpclntcmd -hn client name

如果对结果感到意外,请检查以下名称解析服务的配置:nsswitch.conf 文件、hosts 文件、ipnodes 文件和 resolv.conf 文件。

此外,请在客户端上运行以下命令,检查执行备份的主服务器和介质服务器的正向和反向名称查找:

# bpclntcmd -hn server name

# bpclntcmd -ip IP address of server

步骤 4

验证网络连接。

通过从服务器对客户端进行 Ping 操作,来验证客户端与服务器之间的网络连接。

# ping clientname

其中 clientname 是在 NetBackup 策略配置中所配置的客户端名称。

例如,对名为 ping 的策略客户端进行 ping 操作:

# ping ant 
    ant.nul.nul.com: 64 byte packets
    64 bytes from 199.199.199.24: icmp_seq=0. time=1. ms
    ----ant.nul.nul.com PING Statistics----
    2 packets transmitted, 2 packets received, 0% packet 
    loss round-trip (ms)  min/avg/max = 1/1/1

成功的 ping 操作可验证服务器与客户端之间的连接。如果 Ping 操作失败,并且 ICMP 在主机之间未遭到阻止,请在 NetBackup 之外解决网络问题后再继续。

使用某些形式的 ping 命令可以对客户端上的 bpcd 端口进行 Ping 操作,如以下命令所示:

# ping ant 1556 

按顺序对 1556 (PBX) 和 13724 (vnetd) 进行 Ping 操作,此顺序与 NetBackup 在默认情况下所尝试的顺序相同。您随后便可知道哪些端口是关闭的,以便打开这些端口,使连接尝试更有效。

步骤 5

确保客户端在正确的端口上侦听 bpcd 连接。

在客户端上,请运行下列命令之一(具体取决于平台和操作系统):

netstat -a | grep bpcd
netstat -a | grep 13782
rpcinfo -p | grep 13782

对 1556 (PBX) 和 13724 (vnetd) 重复此操作。如果端口没有出现任何问题,预期的输出如下所示:

# netstat -a | egrep '1556|PBX|13724|vnetd|13782|bpcd' | grep LISTEN
 *.1556          *.*      0      0 49152      0 LISTEN
 *.13724         *.*      0      0 49152      0 LISTEN
 *.13782         *.*      0      0 49152      0 LISTEN

其中的 LISTEN 表示该客户端在端口上侦听连接。

如果 NetBackup 进程正确运行,预期的输出如下所示:

# ps -ef | egrep 'pbx_exchange|vnetd|bpcd' | grep -v grep
root   306 1 0 Jul 18 ? 13:52 /opt/VRTSpbx/bin/pbx_exchange
root 10274 1 0 Sep 13 ?  0:11 /usr/openv/netbackup/bin/vnetd -standalone
root 10277 1 0 Sep 13 ?  0:45 /usr/openv/netbackup/bin/bpcd -standalone

在主服务器和介质服务器上重复此过程,以测试到客户端的通信。

步骤 6

通过 telnet 连接到客户端。

通过 telnet 连接到客户端上的 1556 (PBX) 和 13724 (vnetd)。请检查这两个端口以确保至少在其中一个端口上建立连接。如果 telnet 连接成功,请保持连接,直到完成步骤 8,然后再使用 Ctrl-C 组合键将其终止。

telnet clientname 1556
telnet clientname 13724

其中 clientname 是在 NetBackup 策略配置中所配置的客户端名称。

例如,

# telnet ant vnetd
Trying 199.999.999.24 ...
Connected to ant.nul.nul.com.
Escape character is ‘^]’.

在此示例中,telnet 可以建立一个到客户端 ant 的连接。

在主服务器和介质服务器上重复此过程,以测试到客户端的通信。

步骤 7

标识服务器主机上的出站套接字。

在主服务器和介质服务器上:使用下列命令标识用于步骤 6 中的 telnet 命令的出站套接字。指定服务器将策略客户端解析到的适当 IP 地址。注意源 IP (10.82.105.11)、源端口 (45856) 和目标端口 (1556)。

# netstat -na | grep ‘<client_IP_address>’ | egrep ‘1556|13724’ 
10.82.105.11.45856 10.82.104.99.1556 49152 0 49152 0 ESTABLISHED

如果 telnet 仍然处于连接状态,并且没有显示套接字,请删除端口号过滤功能,并观察站点将服务名映射到的端口号。检查进程是否在步骤 5 中的端口号上侦听。

$ netstat -na | grep ‘<client_IP_address>’ 
10.82.105.11.45856 10.82.104.99.1234 49152 0 49152 0 ESTABLISHED

如果套接字处于 SYN_SENT 状态而不是 ESTABLISHED 状态,则服务器主机会尝试建立连接。但是,防火墙会阻止出站 TCP SYN 到达客户端主机,或者阻止绑定的 TCP SYN+ACK 返回到服务器主机。

步骤 8

确认 telnet 连接到达此客户端主机。

在主服务器和介质服务器上,要确认 telnet 连接到达此客户端主机,请运行下列命令:

$ netstat -na | grep ‘<source_port>’
10.82.104.99.1556  10.82.105.11.45856  49152 0 49152 0 ESTABLISHED

发生以下情况之一:

  • 如果已连接 telnet,但不存在套接字,则 telnet 到达了错误共享与客户端主机拥有相同 IP 地址的某些其他主机。

  • 如果套接字处于 SYN_RCVD 状态而不是 ESTABLISHED 状态,则连接到达了此客户端主机。但是,防火墙会阻止将 TCP SYN+ACK 返回到服务器主机。

步骤 9

验证客户端与主服务器之间的通信。

要验证客户端到主服务器的通信,可使用 bpclntcmd 实用程序。当 -pn-sv 在 NetBackup 客户端上运行时,它们会启动对 NetBackup 主服务器(即在客户端的 bp.conf 文件中配置的主服务器)的查询。然后主服务器将信息返回到请求方客户端。还提供了有关 bpclntcmd 的详细信息。

请参见关于 bpclntcmd 实用程序

PBX、vnetdbprd 调试日志应提供有关任何其余故障性质的详细信息。