删除observer节点报错

【 使用环境 】测试环境
【 OB or 其他组件 】
【 使用版本 】4.1.0
【问题描述】清晰明确描述问题
#可以看到192.168.179.202ip是1009unit
SELECT UNIT_ID,TENANT_ID,STATUS,ZONE,SVR_IP FROM oceanbase.DBA_OB_UNITS;
image

#新增observer节点192.168.179.197
添加节点到同zone,这里是zone1

#把1009代表的192.168.179.202uit迁移到192.168.179.197
ALTER SYSTEM MIGRATE UNIT = 1009 DESTINATION = ‘192.168.179.197:2882’;

#查看迁移结果
#JOB_STATUS 的值为 INPROGRESS 代表迁移在进行中,当该值为 SUCCESS 时,说明迁移成功
SELECT * FROM oceanbase.DBA_OB_UNIT_JOBS WHERE JOB_TYPE = ‘MIGRATE_UNIT’;

#可以看到1009unit已经转变成了192.168.179.197ip
SELECT UNIT_ID,TENANT_ID,STATUS,ZONE,SVR_IP FROM oceanbase.DBA_OB_UNITS;

#删除192.168.179.202节点
ALTER SYSTEM DELETE SERVER “192.168.179.202:2882” zone=‘zone1’;

报错:

4179 - check leader for all LS timeout, delete server not allowed
image

【复现路径】问题出现前后相关操作
【问题现象及影响】

【附件】

1 个赞

可以再操作下 根据报错的trace 提供下日志信息

1 个赞

删除超时,可以在试下,同时观察日志输出。

image

[admin@test3 log]$ cat observer.log|grep “YB42C0A8B3C7-0005FEF083E43D2E-0-0” > err.log
err.log (131.6 KB)

删了很多次了,每次都是超时,看日志没看出是哪里的问题

先stop
再delete

image
image
以上两种隔离方式执行超时,下面执行成功了,但是删除还是报错
image
image

报错日志:

手动kill掉这个observer进程 等到all_server表中为inactive状态后再执行delete操作

按照这个查查吧
https://www.oceanbase.com/knowledge-base/oceanbase-database-20000001040?back=kb

这个尝试了,还是同样的报错


这个版本不一致,下面有些参数是没有的,其次是没有已经迁移后仍无法删除的例子

我们有同学联系你了辛苦看下,拉个小群看吧

算了算了,这个本来就是测试环境,就这样把,我重新搭也快

还是感谢你们的帮助和支持的