OMS迁移到全量验证初始化状态失败,

【 使用环境 】测试环境
【 OB or 其他组件 】OMS
【 使用版本 】oms:feature_4.2.3_ce
【问题描述】全量验证阶段初始化阶段失败:


查看组件状态是,状态一直处于初始化,并且查看日志显示所有日志为空:

image
在点击恢复时提示:

同时有以下提示:

进入docker查看资源显示资源充足,并没有发现资源不够的情况;

或者是当磁盘资源高于80%就停止工作吗?

【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

看上去应该是没有资源了,可以看一下运维监控-机器

资源很充足

点击项目上查看组件监控-选择失败的全量组件重试看看,看能否起来

都失败了,一直初始化状态,也不能恢复。

去OMS元数据库RM库中执行:
SELECT * FROM oms_step WHERE project_id = ‘你当前的项目的id’;
查询出来的数据之后找到step为FULL_VERIFIER这条数据,字段中step_info中应该有个jobId,拿到这个jobId
去OMS元数据库CM库中执行:
SELECT * FROM checker WHERE task_id = ‘上面查到的jobId’;
查出来的记录字段status应该是init状态,改为failed,再重试下