OCP的zone状态异常,该怎么排查?

【 使用环境 】测试环境
【 OB or 其他组件 】OCP
【 使用版本 】4.3.5
【问题描述】
zone状态异常,ocp平台无日志

【复现路径】执行了这个命令
ALTER SYSTEM DELETE SERVER ‘x.x.x.x:2882’ ZONE ‘zone3’;
执行成功后,在ocp页面手动点击zone3启动。
启动后ocp任务里报错,回滚报错任务后,集群拓扑图就这样了

1 个赞

麻烦发一下ocp的任务日志


没有任务啊,有任务我一定贴了,真没任务
我在黑屏上执行了ALTER SYSTEM START ZONE zone3;状态变正常运行了
但是下面那个192.192.33.77的节点我为啥还在,正常应该zone3下面没东西才对

192.192.33.77上data,clog也没清理,正常使用ocp会把目录删干净,是因为我用黑屏删得手工rm吗?

查询下SELECT * FROM oceanbase.DBA_OB_SERVERS;
是的你只是在该集群delete掉这个节点了,黑屏删得手工rm

1 个赞

请问手工rm data目录,clog目录和ob软件目录对吗?

是的

老大,多问一嘴,这三个目录的路径,有没有视图能查到,我官档没找到,准备写节点故障恢复脚本用,写完了就发ob博客上

可以通过查询数据目录。log目前没有查询方法
select * from gv$ob_parameters where name like ‘%data_dir%’
ocp部署的集群数据目录是进行了重定向的所以sql查询数据目录的也不能作为准确路径。
删除路径需要用户自己根据搭建时候的标准化路径配置进行判断。

okok,可以了,感谢

学习了