OB集群从4.3.4升级到4.3.5失败

【 使用环境 】测试环境
【 OB or 其他组件 】
【 使用版本 】
【问题描述】使用obd工具从4.3.4升级到4.3.5版本,Exec upgrade post.py失败。集群状态一直处于upgrading状态
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

1、这个执行一下
image
2、这个也提一下obd日志: 默认保存在安装obd的用户home路径: cd ~/.obd/log/

麻烦再次执行upgrade升级命令。看看是否还报错

obd.log (725.7 KB)

upgrade.log (473.2 KB)

重新执行也是

image

image

sql查询出来的版本和在ocp express显示的版本不一致。

排查下集群机器之间通信是否正常

通信没问题

集群状态upgrading,不能stop和restart

麻烦发下这个文件看下

/usr/local/mysql/share/charsets/Index.xml


没有这个目录

这个目前不存在,是这个问题吗

看下obd的日志执行到upgrade_post升级脚本失败了。对应的在执行命令的目录下,也会有upgrade_post.log 这个日志提供一下

upgrade_post.log (14.6 KB)

看着像是执行升级超时了
select job_status, rs_svr_ip, rs_svr_port, gmt_create from oceanbase.__all_rootservice_job where job_type = ‘UPGRADE_ALL’ and job_id > 23 order by job_id desc limit 1
这个语句执行一下 看看

可能是集群上的业务租户多 导致的升级超时 看着是一直在重试升级

超时时间可以设置长一点吗


可以试一下 这个参数