obshell进行指定时间物理恢复时,任务卡住

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】obshell
【 使用版本 】4.2.5
【问题描述】obshell进行指定时间物理恢复时,任务卡住不动,但是全量恢复又是正常的
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

5 个赞

推荐使用 obdiag 工具进行日志采集,以便我们能够进一步分析和定位问题。请按照以下步骤操作:

日志采集场景: 数据恢复问题
日志采集命令: obdiag gather scene run --scene=observer.recovery

请您先运行上述命令,然后将生成的日志文件提供给我们。这将有助于我们了解在执行指定时间物理恢复时出现卡住的具体原因。

为了更有效地解决问题,麻烦您提供一些额外的信息:

  1. 您是在什么时间点发现恢复任务卡住的?
  2. 卡住之前是否进行了任何特殊的操作或配置更改?
  3. 是否有其他的错误日志或异常信息可以提供?
  4. 恢复任务卡住时,系统的负载情况如何?例如,CPU、内存和IO使用率。
  5. 您尝试过其他方法来解决这个问题吗?如果有,请详细说明。

附上敏捷诊断工具 obdiag 使用帮助链接

4 个赞

命令:/home/ob/observer/bin/obshell tenant restore t2_standy -d file:///data/nas/oceanbase/backup/t1_full -z “zone2” -u unit_1 --timestamp 2025-08-25T09:42:00+08:00 --yes

4 个赞


通过这个命令查看一下恢复任务的详细信息

4 个赞


卡在这里了,不动了

3 个赞

看起来似乎是 ob 中的恢复任务卡住了,可以提供一下 observer 的日志信息吗?

3 个赞

怎么查看和这个恢复有关的日志,我没看到什么异常

2 个赞

把恢复卡住的这段时间的observer.log提供一下 方便排查

1 个赞

日志文件传不上来,太大了,压缩了都有50M

2 个赞

50M应该是可以上传的 256M的日志压缩以后 不会超过50M的 如果是多个文件 建议分开压缩

1 个赞

为什么我设置了日志级别,还在打info级别的日志。

1 个赞

这几个SQL执行看下

show variables like '%version_comment%';

SELECT * FROM oceanbase.CDB_OB_RESTORE_PROGRESS\G;
SELECT * FROM oceanbase.CDB_OB_RESTORE_HISTORY\G;

SELECT * FROM oceanbase.DBA_OB_ROOTSERVICE_EVENT_HISTORY WHERE module='physical_restore';
1 个赞

建议设置wdiag级别的日志 要不然有些信息可能看不到 建议按照楼上的在查一下

1 个赞

是不是plus_archive的备份集不支持时间点恢复?

1 个赞

还有请问有没有查备份集有哪些时间点可以恢复的口径

1 个赞

打卡

卡住时候的详细日志有啥关键信息

1 个赞

学习总结经验 :+1: :+1: :+1:

1 个赞

这个是支持的

show variables like ‘%version_comment%’;

SELECT * FROM oceanbase.CDB_OB_RESTORE_PROGRESS\G;
SELECT * FROM oceanbase.CDB_OB_RESTORE_HISTORY\G;

SELECT * FROM oceanbase.DBA_OB_ROOTSERVICE_EVENT_HISTORY WHERE module=‘physical_restore’; 这几个信息 查一下

它就卡着不动,也没有报错,这个能看出来什么错误吗?