zone内缩容,删除observer节点,状态一直是deleting

【 使用环境 】 测试环境
【 OB or 其他组件 】Oceanbase
【 使用版本 】3.2.3
【问题描述】
当前为2-1-2,准备缩容为1-1-1。删除zone3其中1个节点,使用ocp删除。任务进度卡在wait observer delete。 查看__all_server中,该节点状态为deleting,with_partition值为1。查看__all_unit, 被删除节点的unit都以迁入zone内另一个节点。
【复现路径】登录OCP,进入对应集群概览,删除observer

麻烦提供一份ocp的任务日志

调低server_permanent_offline_time后解决

1 个赞

为什么跟这个server_permanent_offline_time参数有关系呢?

删除Observer过程中要等observer下线才能算删除完成,这个时间太长就一直在等

是因为要删除的机器已经离线了嘛?

应该是没有离线,操作前observer主机都是在线的,从任务流程看卡在了wait observer deleted,查看observer状态是deleting,如果手动删除这条记录卡住的流程就能过。后面把offline参数调低后,等一会这个就能顺利通过

跟以下的文章不符合预期,您可以看一下这个
https://www.oceanbase.com/knowledge-base/ocp-ee-1000000000210134?back=kb

1 个赞

你这个问题和server_permanent_offline_time参数是无关的。删节点需要unit迁移可能是迁移耗时导致