OCP在发起数据恢复后无法选择源租户,并提示 try dump backup file failed 报错

【 使用环境 】生产环境
【 OB or 其他组件 】OB 社区版
【 使用版本 】OceanBase_CE 4.2.1.2
【问题描述】
客户环境通过 OCP(4.2.0版本)发起数据恢复,在进行解析主机后无法显示源租户信息(数据为空)。

经排查ocp.log日志发现ob_admin工具在解析 format.obbak 备份路径元数据信息时发生了报错,显示文件 invalid data type。

format.obbak文件内容:

检查对应租户最近的几次备份情况均正常,且备份路径与 ocp 日志中显示的路径一致。

【复现路径】
1、修改format.obbak文件,在备份路径中添加空格,使其无法正确校验文件。
2、使用ob_admin工具解析备份文件,并将输出信息记录到ob_admin.log日志中,以下为日志输出内容:

经本地测试,在执行备份恢复任务时,如果 format 文件不存在或者 format 文件校验不通过,备份或数据恢复任务会发起失败。但是客户环境备份显示正常,想知道该问题可能产生的原因有哪些以及如何进行修复。

针对您的问题,首先可以利用 obdiag 工具来收集有关数据恢复问题的日志信息,这有助于我们进一步分析问题的原因。同时,因为您遇到了数据恢复过程中的特定错误,我们可以通过 obdiag 的根因分析功能尝试定位错误的根本原因。下面是推荐使用的 obdiag 命令:

根因分析场景: 数据恢复问题
根因分析命令: obdiag rca run --scene=recovery
日志采集场景: 数据恢复问题
日志采集命令: obdiag gather scene run --scene=observer.recovery

请您执行上述命令,将生成的日志文件打包并通过安全的方式发送给我们。这将有助于我们更准确地判断问题所在并提出解决方案。

另外,为了确定具体的问题,在此需要您提供一些信息:

  1. 您能否提供更多的错误消息或日志片段?例如,完整的错误日志输出可以帮助我们更好地理解问题的背景。
  2. 在执行数据恢复操作之前,是否有对 format.obbak 文件进行了任何修改?
  3. 使用的是哪个版本的 ob_admin 工具?确保 ob_admin 的版本与您的 OceanBase 社区版兼容。
  4. 恢复操作是否涉及到了特定的数据表或数据库?如果是,请告知这些表或数据库的特点或特殊配置。
  5. 在尝试恢复数据前,是否有对目标集群进行过任何配置更改或更新操作?
  6. 能否分享一下备份文件的创建时间和方式,以了解备份文件的状态和完整性?

通过回答以上问题,我们将能够获得更多的上下文信息,从而更有效地帮助您解决问题。

附上敏捷诊断工具 obdiag 使用帮助链接

是吧421恢复到420版本么?

  1. 发起数据恢复,日志中会记录 ob_admin 解析后显示数据类型无效的报错,目前仅出现这类日志信息。
  2. format.obbak 是通过ocp平台配置备份策略后,发起备份时自动生成,生产环境不会主动修改文件。
  3. ob_admin 备份恢复使用的同一个,备份任务正常,但是数据恢复时无法执行下去。
  4. 无特定库表,在发起数据前,源租户无法选择。
  5. 恢复数据前,没有做配置项修改。
1 个赞

OCP 版本是420,数据库使用421,在客户环境OCP使用发起数据恢复时,解析主机上已安装ob_admin工具,数据库节点和OCP管理节点操作系统版本一致,但在数据恢复界面上,显示无法选择源租户信息。

format.obbak文件是备份路径格式化信息。非误删,正常情况是不会出问题的。看报错好像是报的超时timeout 这边去咨询下相关同学请稍等。


这个是在客户环境执行的ob_admin结果,没有修改format文件,看着显示文件格式不对。是不是因为无法正确解析导致执行超时了抛出异常。

检查一下磁盘是不是满了

好的,我这边先让客户新建一个备份目录,将备份策略调整下,看看能不能正常恢复数据