【 使用环境 】生产环境
【 OB or 其他组件 】OCP
【 使用版本 】
OCP 版本号: 4.2.1-20231208144448
Observer 3.1.5
【问题描述】集群zone删除后,OCP 仍然存在已删除的zone, 怎么OCP 上删除这个zone信息呢? OCP 上关联的那张表呢?
【复现路径】集群命令行删除无server的空zone,后OCP 查看仍然存在已删除的zone .
【附件及日志】
业务集群 zone 是正常清掉了。但是OCP 这边元数据还存在,怎么一起清理掉呢? OCP 再操作新增zone 也会报已存在zone3 重名这种情况。
删除zone是命令行操作的还是在OCP上操作的?
是集群命令行操作的,测试也无法重新添加回去,再OCP 上删除。所以问下涉及那些ocp 元数据可以清理下
直接清理ocp内部表数据是否可行以及需要清理多少相关表的数据 这个我找相关同学确认下看看
好的 麻烦了
meta_database的表 ob_zone 清理相应记录,另外到ob_server表确认下有没有 server对应的 zone 是 zone3 的脏数据
ob_zone 对应不到集群(根据 cluster_id 关联 ob_cluster表 的ob_cluster_id) 。删除的zone 下没observer
你将ob_zone表里面name='zone3’的记录删除掉 刷新ocp再看看
啊 ,我们OCP 生产多套集群zone3 正常的,只一套zone3不需要的
那删除掉对应cluster_id的zone3的记录
对应不到,ob_zone 里的不是集群实际cluster_id …
稍等,meta_database下ob_server表是空的吗?
select * from ob_server limit 1\G
*************************** 1. row ***************************
id: 1000052
create_time: 2022-06-10 14:21:43
update_time: 2025-01-16 13:27:51
creator: NULL
ip: xxxxx
port: 4882
sql_port: 4881
version: 3.1.4_10000092022071511-b4bfa011ceaef428782dcb65ae89190c40b78c2f(Jul 15 2022 11:45:14)
cluster_id: 1000008
host_id: 1000001
zone_name: zone1
is_with_rootserver: 1
status: RUNNING
inner_status: ACTIVE
operate_status: NORMAL
start_time: 2022-07-18 23:54:21
stop_time: 1970-01-01 08:00:00
ob_server_id: 1
install_path: /home/admin/observer
run_path: /home/admin/observer
run_user: admin 有数据但是,删除的zone下没有 observer(这个表也没有cluster相关字段) ,表里都是正常用的server.
这个查 zone_name='zone3’全部看下
select * from meta_database.ob_server where zone_name=‘zone3’\G;
这些zone_name='zone3’的记录的状态都是正确的,就是你说的在正常使用的observer,也就是ob_server表里面没有脏数据,ob_zone这张表的数据怎么删除我在确认下
status: RUNNING
inner_status: ACTIVE
operate_status: NORMAL