OMS开启增量同步报错

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】OMS
【 使用版本 】社区版4.2.3
【问题描述】使用OMS同步MySQL数据到OB中,选择结构迁移+全量迁移,没问题;选择结构迁移+全量迁移+增量同步时,全量迁移阶段报错The response from the CM service is not success;只选择增量同步时,还是报错The response from the CM service is not success。检查CM服务应该是没有异常,日志中无报错,,只要选择了增量同步,就有问题。
【复现路径】问题出现前后相关操作
【附件及日志】帮忙看看是否需要提供什么日志?

这个报错大概率是资源不够了,建议释放掉一些已经完成的任务再试试呢

楼上说的对,很可能是内存不够。可以看下详细的日志。

只有一个任务的时候也不行,而且资源是够的

supervisor日志无报错。
cm日志看到如下信息:
cm-web.log:2024-05-27 18:47:25 ERROR com.alibaba.drc.biz.dao.service.impl.MysqlServiceImpl.findMMByMaster(MysqlServiceImpl.java:68) - [8df250a3-1801-4a4b-b78c-b54b81ff076a] find slave failed
cm-web.log: at com.mysql.cj.jdbc.exceptions.SQLError.createCommunicationsException(SQLError.java:174) ~[mysql-connector-java-8.0.28.jar:8.0.28]
cm-web.log: at org.springframework.web.filter.OncePerRequestFilter.doFilter(OncePerRequestFilter.java:107) [spring-web-4.3.30.RELEASE.jar:4.3.30.RELEASE]
cm-web.log:2024-05-27 18:49:20 ERROR com.alibaba.drc.biz.dao.service.impl.MysqlServiceImpl.findMMByMaster(MysqlServiceImpl.java:68) - [68ee51c0-de64-4d8e-9e10-7442b3d071ff] find slave failed
cm-web.log: at com.mysql.cj.jdbc.exceptions.SQLError.createCommunicationsException(SQLError.java:174) ~[mysql-connector-java-8.0.28.jar:8.0.28]
cm-web.log: at org.springframework.web.filter.OncePerRequestFilter.doFilter(OncePerRequestFilter.java:107) [spring-web-4.3.30.RELEASE.jar:4.3.30.RELEASE]
cm-web.log:2024-05-27 18:51:31 ERROR com.alibaba.drc.biz.dao.service.impl.MysqlServiceImpl.findMMByMaster(MysqlServiceImpl.java:68) - [68ee51c0-de64-4d8e-9e10-7442b3d071ff] find slave failed
cm-web.log: at com.mysql.cj.jdbc.exceptions.SQLError.createCommunicationsException(SQLError.java:174) ~[mysql-connector-java-8.0.28.jar:8.0.28]
cm-web.log: at org.springframework.web.filter.OncePerRequestFilter.doFilter(OncePerRequestFilter.java:107) [spring-web-4.3.30.RELEASE.jar:4.3.30.RELEASE]

补充一下版本,源端MySQL8.0.28,目标端OB4.2.1.1,OMS4.2.2

你好,可以登入oms容器执行supervisorctl status 看看结果

1 个赞

这个结果显示也是正常的。
image

相同的数据源和目标库,相同的表,相同配置,加了增量同步就失败。

结合日志看,大概率还是资源问题。再看下free -g和oms任务列表,oms应该不是多节点吧

oms是单节点的,机器配置16C256G的,上面就跑了个mysql+图数据库+oms,资源充足。

截图看一下

进入链路-查看组件监控 截图

是不是连了备库?
Show Slave Status 在源库上执行一下看看


数据源这里需要按照实际情况来选择

截图信息如下,数据源在华为云上,从云下实时同步上去的一个可读写的灾备库。


数据源新建的时候,数据库属性你是怎么选择的?有没有选择备库?

链路中-链接详情截图看一下

只选择了主库

数据源新建的时候要选备库,因为你的数据实际就是备库,数据源重新建一个,再新建链路试试