使用运维工具重启后,无法再次启动oceanbase

【 使用环境 】 测试环境
【 OB or 其他组件 】
【 使用版本 】
【问题描述】使用运维工具重启后,无法再次启动
【复现路径】问题出现前后相关操作
【附件及日志】
版本是:5.7.25-OceanBase_CE-v4.5.0.0
使用管理界面 重启后,无法正常启动
image

出现以下报错日志:
ERROR: [Common.Unexpected]: Unexpected error: 11.224.0.19:2886 failed to end the task : Request [POST]/api/v1/task/dag/20199229459028864 to 11.224.0.16:2886 error: Failed to pass DAG: DAG is not failed

2026-03-18 16:33:22

11.224.0.19:2886 end the task

2026-03-18 16:33:22

ERROR: [Common.Unexpected]: Unexpected error: 11.224.0.204:2886 failed to end the task : Request [POST]/api/v1/task/dag/20199229644028864 to 11.224.0.16:2886 error: Failed to pass DAG: DAG is not failed

2026-03-18 16:33:22

11.224.0.204:2886 end the task

2026-03-18 16:33:23

ERROR: [Common.Unexpected]: Unexpected error: 11.224.0.31:2886 failed to end the task : Request [POST]/api/v1/task/dag/20199229471028864 to 11.224.0.16:2886 error: Failed to pass DAG: DAG is not failed

2026-03-18 16:33:23

11.224.0.31:2886 end the task

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

3 个赞

针对您提到的问题,建议先使用 obdiag 工具进行日志采集,以便我们能够从日志中找到导致无法启动的具体原因。根据您提供的信息,这里我们选择“observer无故重启”的场景,尽管这通常是用于诊断观察者进程意外重启的情况,但同样可以用来捕获和分析启动失败的相关日志。

日志采集场景: observer无故重启
日志采集命令: obdiag gather scene run --scene=observer.restart

请您执行上述命令并提供收集到的日志文件。同时,为了更好地帮助您定位问题,请您回答以下几个问题:

  1. 您是否有在最近更新过 OceanBase 或者进行了某些配置上的修改?
  2. 您能否提供更详细的错误日志信息,特别是 ‘DAG is not failed’ 报错周围的日志内容?
  3. OceanBase 系统的硬件资源(如 CPU、内存、磁盘空间等)当前状态如何?
  4. 在尝试重新启动之前,OceanBase 是否正常运行?如果有异常表现,请描述。
  5. 您使用的是哪个版本的 OceanBase?部署模式是什么样的?(例如 OCP、OBD 或手动部署)
  6. 该问题是否可复现?即每次重启都会遇到相同的问题吗?

通过以上信息,我们可以进一步缩小问题范围并提供更精确的帮助。

附上敏捷诊断工具 obdiag 使用帮助链接

2 个赞

日志采集命令: obdiag gather scene run --scene=observer.restart 是在哪里使用

2 个赞

提供一份observer日志看看

2 个赞

学习

1 个赞

学习

是请问下是哪个日志

手动重启一下失败后提供最新的observer.log日志

1 个赞

手动在这个路径下启动

以下为手动启动的日志,麻烦看下报错信息未提示什么有价值信息
observer.log (267.3 KB)

1 个赞

已修复正常启动

some config setting is not valid
参数配置有问题