使用ocp对已接管的ob集群从4.1.0升级到4.2.0失败

【 使用环境 】 测试环境
【 OB or 其他组件 】ocp,observer
【 使用版本 】ob集群版本:社区版4.1.0.0_100000202023040520 ocp版本:社区版4.0.3-20230301
【问题描述】2023年8月31日 19:14:47 使用ocp对已接管的ob集群从4.1.0升级到4.2.0,在执行"Execute upgrade pre script"时报错,日志中一直提示的信息为:
[2023-09-04 09:51:25] INFO upgrade_health_checker.py:46 succeed to execute query: select /*+ query_timeout(1000000000) */ count(1) from __all_virtual_tablet_compaction_info where max_received_scn > finished_scn and max_received_scn > 0, rowcount = 1
[2023-09-04 09:51:25] INFO upgrade_health_checker.py:350 value is 3, expected value is 0, not matched

【复现路径】

先在ocp上上传新版的OceanBase安装包

image

集群管理选择需要升级的集群

image

选择升级的版本

image
image

ocp任务详细日志:
log_task_707752(2).zip (59.7 KB)

根据任务提示的语句查询结果如下:


查询结果1.txt (13.7 KB)

集群zone和合并的状态 是正常的
image
image

测试环境,集群下无长事务和悬挂事务
image
image

修改以下参数,重试任务还是失败,失败原因还是一样
alter system set internal_sql_execute_timeout=‘10m’

pre升级脚本是可以重试的,重试能解决么?

重试了三次,解决不了哈

一样的报错位置吗

是的,

我们内部再看下