【 使用环境 测试环境
【 OB or 其他组件 】obd
【 使用版本 】oceanbase-ce all 4.2
【问题描述】单机意外停电后,使用obd cluster restart myoceanbase失败,步骤connect to observer耗时很久,主机上检查observer没有正常启动
【复现路径】obd cluster restart myoceanbase
3 个赞
麻烦提供一份observer日志
1 个赞
ail to start server checkpoint slog handler(ret=-4016
可能是slog日志出现损坏了。断电可能会导致磁盘损坏,先查查磁盘是否存在异常
1 个赞
磁盘读写目前是正常的,是不是之前的slog损坏了?
1 个赞
是的,应该是突然断电导致slog文件损坏
1 个赞
没有备份的话,只能重建了吧
1 个赞
是的。
1 个赞
做笔记
1 个赞
这机房断点就是灾难呀,怎么规避?怎么修复?
搭建灾备或使用高可用集群
这种情况只有,多机房才解决了吗?
如:2到3个机房存放集群。
断电这种情况,对于机房主机来说很大概率会导致文件损坏或硬件损坏。单节点环境如果遇到一种就会导致集群不可用而且无法恢复。使用1-1-1这种高可用可以提高安全性,当然多机房部署更加安全
1 个赞
1-1-1三节点在同一个机房断电概率也是挺高的,如果三节点全有日志损坏,那么集群不可用,只能通过备份。
如果其中一台,少数派日志损坏,就将节点踢掉就可以正常运行了。
SLOG, CLOG都易损文件吧?尤其在高速写入。
1 个赞
断电在个人电脑上使用的话还是蛮常见的,可以自动修复或者提供工具修复SLOG吗?可以接受损失最后几条数据。
也不知道你是单机模式,还是集群模式,如果单机模式,更容易损坏clog 日志