通过ocp4.3.3把observer从4.2.4.0升级到4.2.5.1报错卡在start obshell process

【 使用环境 】生产环境
【 OB or 其他组件 】ocp和observer
【 使用版本 】ocp4.3.3 observer 4.2.4.0
【问题描述】通过ocp4.3.3把observer从4.2.4.0升级到4.2.5.1报错卡在start obshell process


log_obshell.tar.gz (15.7 KB)
subtask_14019240.zip (24.3 KB)
以上是obshell的日志和子任务的日志

现在有个问题就是由于我升级失败后主任务Submit upgrade OB cluster dag任务我是回滚成功的,但是Upgrade OB cluster任务是没法回滚的,导致我3节点observer有一个节点已经是4.2.5.1了,剩下两个节点还是4.2.4.0。


然后我再点升级就会出现如下情况

现在我该怎么恢复到4.2.4.0以及升级遇到的问题该怎么解决。

麻烦下载ocp完整的任务日志发下(不只是子任务日志)

log_task_14018194.tar.gz (47.4 KB)

问题1:升级失败
–这里obshell启动失败,麻烦发下yaml配置文件,是否修改过root_password?

2024-12-14 10:16:15.602  INFO 14878 --- [manual-subtask-executor14,5dec0959f7be39b3,e00f6988dbe1d0cf] c.o.o.e.internal.template.HttpTemplate   : POST request to agent, url:http://192.168.66.150:62888/api/v1/process/startObShellProcess, request body:OperationObShellProcessRequest(installPath=/home/admin/oceanbase, runPath=/home/admin/oceanbase, port=2886, ip=192.168.66.150, rootpassword=xxx, params:null

问题2:由于我升级失败后主任务Submit upgrade OB cluster dag任务我是回滚成功的,但是Upgrade OB cluster任务是没法回滚的,导致我3节点observer有一个节点已经是4.2.5.1了,剩下两个节点还是4.2.4.0,现在我该怎么恢复到4.2.4.0以及升级遇到的问题该怎么解决?

–目前是不支持回退版本的,麻烦查看下目前的集群状态

select * from dba_ob_servers;
select * from dba_ob_zones;

1.yaml配置文件在哪
2.

1.确认下:这个集群是OBD部署的,然后使用OCP接管的?还是直接使用OCP部署的?

直接ocp部署的

已确认是OCP升级的时候漏了一个判断,我们将尽快推出修复版本。
目前可以通过跳过这个任务来绕过,这个任务的跳过并不会影响后续集群的升级和运行,请放心

像我这种Submit upgrade OB cluster dag任务已经回滚的,Upgrade OB cluster任务继续执行会有影响吗?

可以继续升级

再次感谢反馈,我们将在这两天发布hotfix版本

好的谢谢,晚点我升级下

OCP4.3.3升级4.2.1.8到4.2.1.10也是一样的问题,什么时候有修复版本呀

预计明天(12月20号)就会发布修复版本

修复版本OCP 433 BP1 已发布,可以到下载中心下载更新