ocp中集群列表状态疑问


ocp中单点集群任务都显示失败了,但是集群列表还是显示创建中而不是停止

1 个赞

666

  • OCP 在执行集群初始化时,无法连通 / 正常访问 OB 节点的 observer 进程,导致根服务启动超时失败;
  • 任务流虽然子任务失败,但 OCP 的集群状态机没有触发回滚 / 终止逻辑,因此集群列表一直显示「创建中」,且没有停止 / 删除按钮。

第一步:先终止任务流,触发 OCP 自动回滚
第二步:手动清理 OB 节点残留,强制终止进程
第三步:OCP 后台强制删除异常集群
第四步:修复 Bootstrap ob 失败的根本原因

  • 网络连通性

  • 检查 OCP 服务器到 OB 节点的 2881、2882 端口是否通:telnet <OB节点IP> 2881

  • 检查 OB 节点的防火墙 / 安全组是否放行 2881、2882、2883 端口

  • 检查节点间主机名解析是否正常(/etc/hosts 配置 OCP 和 OB 节点的 IP - 主机名映射)

  • 资源配置检查

  • 单点集群最低要求:CPU≥4 核,内存≥8G,磁盘≥100G(SSD)

  • 若内存不足,在创建集群时修改参数 __min_full_resource_pool_memory = 1G,降低资源门槛

  • 时钟同步检查

  • OceanBase 要求节点间时钟偏差≤100ms,执行:clockdiff <OB节点IP>

  • 若偏差过大,配置 chrony/ntp 同步时钟后再重试