ocp平台上新增observer失败

有一台observer主机10.1.1.1故障宕机无法启动,想使用10.2.2.2新的主机来替换,先把10.1.1.1删除了,然后在对应的zone中重新添加的新的主机


任务显示失败,还在去找老的主机

这是什么原因呢?老的主机已经通过ocp平台删除了
该怎么解决 呢

10 个赞

删除干净了么,使用ocp删除的?

4 个赞

是的,我只在主机那里点的删除
然后observer列表里也就不显示了
是不是这个的原因

3 个赞

是删除这个节点主机了么 没有在集群节目删除该节点么。这样是有问题的,先加回来吧

5 个赞

是的只是这样删除了,然后observer列表也不显示了
那先在主机那里把老的机器加回来吗?
但是这个 机器已经连不上了,故障起不来了,主机那加不回去了

3 个赞

先回滚掉任务吧。
ob集群也没删掉这个节点,先参考官方文档黑屏化把他删掉
https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000005682469

5 个赞

回滚失败了还

2 个赞

任务日志提供一份,
到ocp_meta租户下查询下这个sql cluster_id在ocp界面获取
select * from meta_database.ob_server where cluster_id=xxxx;
image

1 个赞

不知道ocp_meta密码了,感觉当时没配置啊

1 个赞

到obd节点~/.obd/cluster/xxx/的yaml文件查一下这个租户的密码

1 个赞


结果里面已经没有老的了

1 个赞

任务日志发一下吧

2 个赞

log_task_2277023.zip (56.2 KB)
点击回滚,回滚失败后下载的日志

2 个赞


这个12不是你新ip么 为啥上面说报错显示找不到老主机

2 个赞

这个是老的主机ip,新的是35.12


新的上面虽然添加失败了,但是感觉数据在均衡

1 个赞

ob集群侧添加observer是成功了的,修改集群属性异常,那你上面10.1.1.1是什么ip
image
到资源管理界面把12节点的全部迁走

1 个赞

这个ip是我改的假的

1 个赞

image

空的选不了,资源不够了吗这是

1 个赞

该怎么搞啊,老师

1 个赞

直接在主机那里删除旧节点,集群侧是不是也执行过删除啊

1 个赞