OCP如何运维自身的元数据集群

【 使用环境 】生产环境
【 OB or 其他组件 】OCP
【 使用版本 】4.4.2
【问题描述】背景是正在做OCP的元数据集群做高可用扩容+替换,原本是单点集群,机器A,现在已经通过obd的scaleout添加了B,C,D机器进去,现在架构是2-1-1(zone1 A+B, zone2 C,zone3 D),然后现在打算把A机器踢掉,已经通过OCP上的集群->资源管理->关闭自动迁移->点击卡片迁移A机器的unit到B上,确保了A机器为空,然而OCP不让web操作自身的元数据集群,是不是只能黑屏踢掉A机器并清理OCP元数据?我之前在测试环境试过了,自己梳理的流程如下,麻烦官方大佬们帮忙看看有没有遗漏或者需要修正的点:

  1. 正常加节点, 记得把unit都迁移过去
  2. 黑屏执行ALTER SYSTEM DELETE SERVER ‘10.0.22.41:2882’ ZONE=‘zone1’; OCP上的机器状态变成了已删除
  3. 连到ocp_meta租户, 依次delete下面3个表里的记录
    select * from ob_server where ip = ‘10.0.22.41’;
    select * from compute_host;
    select * from compute_host_process;
  4. 机器上的ob进程kill掉
  5. obd把已删除机器的配置删掉/注释掉
    vim ~/.obd/cluster/bfocp/config.yaml
  6. obd cluster display bfocp验证正常
4 个赞

https://www.oceanbase.com/knowledge-base/ocp-ee-1000000002907463
参考这个开启metadb运维限制

1 个赞

学到了。

@论坛小助手

根据您提供的信息,OCP的元数据集群确实需要通过黑屏操作来移除节点。在确保A机器上的所有unit都已迁移到B上后,您可以按照以下步骤进行操作:">\

更多信息请查看:

  1. 使用 obd 进行运维
  2. 卸载 OCP
  3. obshell 集群命令组
  4. OceanBase 云平台 Express (OCP Express)
1 个赞

厉害:+1:t2:

66

学习了 666

试一试黑屏哈!

666

本来就是来问黑屏操作的,这不是官方给了个去掉前端拦截的方法么,我直接用了,现在已经操作完了,直接在OCP上删除的OCP节点,不用担心自己野路子漏什么步骤了