OCP的zone状态异常,该怎么排查?

【 使用环境 】测试环境
【 OB or 其他组件 】OCP
【 使用版本 】4.3.5
【问题描述】
zone状态异常,ocp平台无日志

【复现路径】执行了这个命令
ALTER SYSTEM DELETE SERVER ‘x.x.x.x:2882’ ZONE ‘zone3’;
执行成功后,在ocp页面手动点击zone3启动。
启动后ocp任务里报错,回滚报错任务后,集群拓扑图就这样了

4 个赞

麻烦发一下ocp的任务日志

2 个赞


没有任务啊,有任务我一定贴了,真没任务
我在黑屏上执行了ALTER SYSTEM START ZONE zone3;状态变正常运行了
但是下面那个192.192.33.77的节点我为啥还在,正常应该zone3下面没东西才对

192.192.33.77上data,clog也没清理,正常使用ocp会把目录删干净,是因为我用黑屏删得手工rm吗?

2 个赞

查询下SELECT * FROM oceanbase.DBA_OB_SERVERS;
是的你只是在该集群delete掉这个节点了,黑屏删得手工rm

3 个赞

请问手工rm data目录,clog目录和ob软件目录对吗?

2 个赞

是的

2 个赞

老大,多问一嘴,这三个目录的路径,有没有视图能查到,我官档没找到,准备写节点故障恢复脚本用,写完了就发ob博客上

2 个赞

可以通过查询数据目录。log目前没有查询方法
select * from gv$ob_parameters where name like ‘%data_dir%’
ocp部署的集群数据目录是进行了重定向的所以sql查询数据目录的也不能作为准确路径。
删除路径需要用户自己根据搭建时候的标准化路径配置进行判断。

2 个赞

okok,可以了,感谢

2 个赞

学习了

2 个赞

学习了,OB真的要活学活用

3 个赞

芜湖,看来还是少一边黑屏一边白屏操作好,不易触发类似问题

能用白屏的尽量不要用黑屏,白屏操作不了再考虑黑屏

1 个赞

是的,能用白屏的尽量不要用黑屏,白屏操作不了再考虑黑屏

1 个赞