OCP集群一直处于删除中状态

【 使用环境 】生产环境
【 OB or 其他组件 】OCP
【 使用版本 】OCP 4.3.1
【问题描述】
删除集群任务失败,删除集群任务下没有子任务,集群状态一直在删除中,麻烦帮忙看下怎么安全清理下这个集群在OCP的数据,包括这个任务中心的删除集群的任务。

前因:
环境内有一个集群需要下线,但是主机侧在 我们OCP 上还未删除集群时将主机下线掉了,然后我们再发起的删除集群的任务。

【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

3 个赞

在ocp上把主机再加回去,有一些任务需要使用agent来跑的,加回去后如果任务失败了,就重试一下或回滚重新删除一下

4 个赞

OCP 的任务设置为成功,登陆主机手动删除目录和文件就卸载干净了,接着重新创建集群就行

4 个赞

已经删除失败了

2 个赞

这个状况优点骑虎难下了啊

现在OCP点进集群概览里,没有删除集群的选项,这个集群其实已经删除完了。这个是不是需要删除meta元数据库的 相关表的信息记录

OCP4.3.6以下只能删除OCP元数据库相关数据解决,OCP4.3.6支持删除类似空集群,废弃集群,后续版本也会提供接口处理这样的问题

1.根根据ocp 的 ob 集群 id (cluster_id)删除下表中的相应记录, 注意不是ob_cluster_id
ob_cluster
ob_server
ob_tenant

2.如果还有脏数据,根据 host_id 删除下表中的相应记录
compute_host
compute_host_process
compute_host_service

3.根据 instance 的 ip 删除下表中的相应记录
ocp_exporter_address

1 个赞

麻烦您重新发下图片,当前发的图片我们无法看到,后续我们会用下您当前给的方案,谢谢。

删除集群时,找不到节点了,删个锤子 :joy: