【 使用环境 】 测试环境
【 OB or 其他组件 】Oceanbase
【 使用版本 】3.2.3
【问题描述】
当前为2-1-2,准备缩容为1-1-1。删除zone3其中1个节点,使用ocp删除。任务进度卡在wait observer delete。 查看__all_server中,该节点状态为deleting,with_partition值为1。查看__all_unit, 被删除节点的unit都以迁入zone内另一个节点。
【复现路径】登录OCP,进入对应集群概览,删除observer
麻烦提供一份ocp的任务日志
调低server_permanent_offline_time后解决
1 个赞
为什么跟这个server_permanent_offline_time参数有关系呢?
删除Observer过程中要等observer下线才能算删除完成,这个时间太长就一直在等
应该是没有离线,操作前observer主机都是在线的,从任务流程看卡在了wait observer deleted,查看observer状态是deleting,如果手动删除这条记录卡住的流程就能过。后面把offline参数调低后,等一会这个就能顺利通过
你这个问题和server_permanent_offline_time参数是无关的。删节点需要unit迁移可能是迁移耗时导致