OCP如何运维自身的元数据集群

【 使用环境 】生产环境
【 OB or 其他组件 】OCP
【 使用版本 】4.4.2
【问题描述】背景是正在做OCP的元数据集群做高可用扩容+替换,原本是单点集群,机器A,现在已经通过obd的scaleout添加了B,C,D机器进去,现在架构是2-1-1(zone1 A+B, zone2 C,zone3 D),然后现在打算把A机器踢掉,已经通过OCP上的集群->资源管理->关闭自动迁移->点击卡片迁移A机器的unit到B上,确保了A机器为空,然而OCP不让web操作自身的元数据集群,是不是只能黑屏踢掉A机器并清理OCP元数据?我之前在测试环境试过了,自己梳理的流程如下,麻烦官方大佬们帮忙看看有没有遗漏或者需要修正的点:

  1. 正常加节点, 记得把unit都迁移过去
  2. 黑屏执行ALTER SYSTEM DELETE SERVER ‘10.0.22.41:2882’ ZONE=‘zone1’; OCP上的机器状态变成了已删除
  3. 连到ocp_meta租户, 依次delete下面3个表里的记录
    select * from ob_server where ip = ‘10.0.22.41’;
    select * from compute_host;
    select * from compute_host_process;
  4. 机器上的ob进程kill掉
  5. obd把已删除机器的配置删掉/注释掉
    vim ~/.obd/cluster/bfocp/config.yaml
  6. obd cluster display bfocp验证正常
1 个赞

https://www.oceanbase.com/knowledge-base/ocp-ee-1000000002907463
参考这个开启metadb运维限制