数据库宕机,子节点无法启动,无法添加新节点

今天Oceanbase数据库出现停机警告,然后数据库宕机了,我的数据库有2个节点,当前我的其中一个节点可以正常启动,但是另一个节点启动后立马就会宕机,导致数据库无法正常启动。这种问题该如何解决?另外这种情况如何添加新节点,抛弃无法启动的节点?

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】
【 使用版本 】
【问题描述】清晰明确描述问题
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

2 个赞

针对您的问题,我们首先需要确定当前节点无法启动的具体原因,以便能够采取正确的措施进行恢复。在此过程中,obdiag 工具可以帮助我们快速地收集必要的日志信息,为后续的诊断和恢复提供依据。

日志采集场景: observer无故重启
日志采集命令: obdiag gather scene run --scene=observer.restart

建议您先执行上述命令,收集有关节点无法启动的相关日志信息,并将日志文件提供给我们,这有助于我们更准确地定位问题。同时,请您回答以下几个问题,以便我们更好地理解当前的情况:

  1. 您是否尝试过重启该节点的服务?重启服务的结果是什么?
  2. 故障节点是否有任何异常的日志输出?例如,是否有特定的错误代码或错误消息?
  3. 在尝试启动该节点时,控制台或日志中显示了哪些具体的错误信息?
  4. 当前集群的状态如何?其余节点是否正常运行?
  5. 您计划用什么方法添加新的节点来替换故障节点?是否有使用 OBD 等工具?

根据您的反馈,我们将进一步指导您如何恢复数据库运行及正确地添加新节点。

附上敏捷诊断工具 obdiag 使用帮助链接

如果只有两个节点的话 其中一个节点宕机了 另一个节点也会有问题的 不满足多数派

1 个赞

如果只剩一台机器,会不会自动降为单机一体式数据库,而不是分布式数据库呢

不会 不满足多数派 也会有问题的

那把另一台解决了,再加回来就行了吧

如果两台都能启动 是没有问题的