ocp提醒租户合并异常

【 使用环境 】生产环境
【 OB or 其他组件 】ob4.1.0
【 使用版本 】
【问题描述】
ocp提示ob集群主租户合并异常,9天未合并了。


点击清除异常,合并中,还是报错无法合并,中间提示服务器异常。

ocp日志和observer.log日志麻烦提供下呢。

observer.log.7z (2.8 MB)
ocp.log.7z (3.5 MB)

请问手动合并可以成功吗?手动合并可以参考 OceanBase分布式数据库-海量数据 笔笔算数

当前磁盘是什么磁盘?
[2024-02-20 11:10:53.593605] ERROR detect_palf_hang_failure_ (ob_failure_detector.cpp:346) [15215][T1002_Occam][T1002][Y0-0000000000000000-0-0] [lt=13][errcode=-4392] disk is hung(msg=“clog disk may be hung, add failure event”, clog_disk_hang_event={type:PROCESS HANG, module:LOG, info:clog disk hang event, level:FATAL}, clog_disk_last_working_time=1708398647950638, hung time=5642832)
看像是磁盘问题。

没测试,不过ocp上面的不好使了

机器是虚拟机的,应该是虚拟的磁盘,这个有影响吗?

可以尝试一下手动合并,看能否成功

好的,谢谢


登录的用户租户,执行的手动合并,提示是成功了,记录没查到。
这是怎么回事?

select * from __all_zone; 看下这个

上次11号开始的合并任务并未结束,一直在合并中。可以先参考这个帖子看看

好的,我试下


老师,执行SELECT * FROM __all_zone,上面的图片未显示merge_status这个字段啊。
排查不到那台机器的卡顿啊


可能较低的版本有

我们使用的是ob4.1.0版本,这个要怎么排查?
我这边在官方搜索了,没发现什么异常的,都是查询的是空
SELECT * FROM __all_zone WHERE name IN (‘merge_status’,‘all_merged_version’);

1 个赞


社区版看这个字典。但是您上面发的应该还是在合并中。并没有结束吧 。

现在查询下这个表看看是什么状态

1 个赞

select * from GV$OB_COMPACTION_PROGRESS; 这个信息贴下看看

OB_COMPACTION_PROGRESS.txt (246.1 KB)
daren租户.txt (106.5 KB)
经排查是204.3的节点在11号合并卡住了,如何能确定下那?