oceanbase-CE单机意外停电,obd cluster restart失败,observer无法启动

【 使用环境 测试环境
【 OB or 其他组件 】obd
【 使用版本 】oceanbase-ce all 4.2
【问题描述】单机意外停电后,使用obd cluster restart myoceanbase失败,步骤connect to observer耗时很久,主机上检查observer没有正常启动
【复现路径】obd cluster restart myoceanbase

3 个赞

麻烦提供一份observer日志

1 个赞

obd.log (49.8 KB)

2 个赞

observer.log.gz (11.0 MB)

1 个赞

ail to start server checkpoint slog handler(ret=-4016
可能是slog日志出现损坏了。断电可能会导致磁盘损坏,先查查磁盘是否存在异常

1 个赞

磁盘读写目前是正常的,是不是之前的slog损坏了?

1 个赞

是的,应该是突然断电导致slog文件损坏

1 个赞

没有备份的话,只能重建了吧

1 个赞

是的。

1 个赞

做笔记

1 个赞

这机房断点就是灾难呀,怎么规避?怎么修复?

搭建灾备或使用高可用集群

这种情况只有,多机房才解决了吗?
如:2到3个机房存放集群。

断电这种情况,对于机房主机来说很大概率会导致文件损坏或硬件损坏。单节点环境如果遇到一种就会导致集群不可用而且无法恢复。使用1-1-1这种高可用可以提高安全性,当然多机房部署更加安全

1 个赞

1-1-1三节点在同一个机房断电概率也是挺高的,如果三节点全有日志损坏,那么集群不可用,只能通过备份。
如果其中一台,少数派日志损坏,就将节点踢掉就可以正常运行了。
SLOG, CLOG都易损文件吧?尤其在高速写入。

1 个赞

断电在个人电脑上使用的话还是蛮常见的,可以自动修复或者提供工具修复SLOG吗?可以接受损失最后几条数据。

也不知道你是单机模式,还是集群模式,如果单机模式,更容易损坏clog 日志