断电服务器重启后,ocp 集群启动失败 ObTimeWheel is not inited

【 使用环境 】生产环境
【 OCP 启动 】
【 使用版本 】
【问题描述】断电服务器重启后,ocp 集群启动失败 ObTimeWheel is not inited

相关日志.zip (11.7 MB)

1 个赞

日志中显示磁盘存在坏块,可能断电导致磁盘故障了,麻烦先排查下磁盘问题
info=“the block has been corrupted!!!”)

1 个赞

好的,机房查看了一下,确实存在一个磁盘损坏情况,因为是单机部署的这个 ocp 集群,就是 ocp 白屏方式部署的,oceanbase 云平台使用的集群是个单机集群,部署完成后,在 oceanbase 云平台上又部署了三台服务器,配置了一个三台的小业务集群,现在是 ocp 这个挂了,另外倒是还能用,针对现在磁盘损坏的情况,要怎么处理啊,有什么建议么?

1 个赞

但是,我这边其实也做了磁盘阵列,做的应该是 raid 50 的,我使用 smartctl 检测的时候,好像也是好的。

1 个赞

建议尽快修复磁盘,如果集群无法启动,需要重新搭建ocp了,后续将业务集群接管到新的ocp中即可

能直接接管么,我看之前接管的时候,需要这边先托管的

可以

我可以对现有坏盘的这个服务器上的ocp进行ocp单机销毁么,因为当初部署 ocp 的时候就是单机部署的,只不过通过这个 ocp 去部署了一个三台的ob集群,现在三台的ob集群是好的,因为这个 ocp 所在服务器磁盘损坏的现象,我想要直接使用命令 obd cluster destroy 这个 ocp 单机服务,然后,再去把相关的文件删除,这样的操作路径下,不会影响那三台的ob集群吧?

不影响业务集群