OMS启动任务报错

【 使用环境 】测试环境
【 OB or 其他组件 】OMS 4.2.3
【 使用版本 】
【问题描述】启动任务报错,请问如何处理~
【复现路径】

【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

OMS容器中
/home/admin/logs/ghana/Ghana/common-error.log 传一下

找到了,我们的oms部署了2个节点,

一节点未发现相关报错,附件如下:
common-error.log (522.8 KB)

二节点发现相关报错,
common-error-02.log (53.4 KB)

任务id:np_5q3vq5huh2o0

其他任务没报错,我怀疑是不是正则过滤匹配的内容太多。

减少一点排除过滤列表,太多了配置表存不下
另外你的第一个错误日志中,看上去cm链接错误,172.21.32.36这台机器上cm服务有问题,或者是网络链接不通,2个节点的情况,172.21.32.36这应该是个vip
2024-05-11 10:46:23.220 [pool-7-thread-27] ERROR c.a.o.c.s.i.c.CmClientUtil 74 - [1e103690-a21b-4919-a141-379fb74d3bc6] Failed to complete http request: Connect to 172.21.32.36:8088 [/172.21.32.36] failed: connect timed out
org.apache.http.conn.ConnectTimeoutException: Connect to 172.21.32.36:8088 [/172.21.32.36] failed: connect timed out
at org.apache.http.impl.conn.DefaultHttpClientConnectionOperator.connect(DefaultHttpClientConnectionOperator.java:151)
at org.apache.http.impl.conn.PoolingHttpClientConnectionManager.connect(PoolingHttpClientConnectionManager.java:376)
at org.apache.http.impl.execchain.MainClientExec.establishRoute(MainClientExec.java:393)
at org.apache.http.impl.execchain.MainClientExec.execute(MainClientExec.java:236)

您好,但是就是需要这么多,能否通过扩大表字段处理呢~

排除的所有表发一下,我们本地试一下,另外你看一下oms元数据库是否正常

太感谢了。

应用:
ftsp_product.*

排除:
ftsp_product.csp_delivery_error_htxx

ftsp_product.ftsp_chjj_chxx

ftsp_product.ftsp_ht_hsxx

ftsp_product.ftsp_ht_khfw_error

ftsp_product.ftsp_infra_pzmbxx

ftsp_product.ftsp_infra_pzmbxx_mx

ftsp_product.ftsp_kh_cjxx

ftsp_product.ftsp_kh_fwda_khpj

ftsp_product.ftsp_kh_fwda_qylxr

ftsp_product.ftsp_kh_gmjl

ftsp_product.ftsp_kh_jcxx

ftsp_product.ftsp_kh_khswxx

ftsp_product.ftsp_kh_pg

ftsp_product.ftsp_kh_pg_user

ftsp_product.ftsp_kh_qyz_glqr

ftsp_product.ftsp_kh_tyxx

ftsp_product.ftsp_kh_tyxx_hsxx

ftsp_product.ftsp_kh_tyxx_log

ftsp_product.ftsp_wq_fwsx

ftsp_product.ftsp_wq_task

ftsp_product.ftsp_wq_task_bslc

ftsp_product.ftsp_wq_task_fwsx

ftsp_product.ftsp_wq_task_user

ftsp_product.ftsp_zt_ywxx

ftsp_product.ftsp_zt_ztxx

ftsp_product.srep_mo_mysql_rep_heartbeat_for_satp

ftsp_product.dm_bi_csp_kh_tag

ftsp_product.ftsp_api_mq_request_log

ftsp_product.ftsp_sb_sbgjj_config

ftsp_product.ftsp_sb_account_requirement

ftsp_product.ftsp_rjz_bank_dzd_common

ftsp_product.ftsp_rjz_bank_dzd

ftsp_product.ftsp_rjz_yctq_task

ftsp_product.ftsp_infra_bank_modal

ftsp_product.ftsp_infra_bank_modal_mx

ftsp_product.ftsp_fp_common

ftsp_product.ftsp_fp_common_mx

源端和目标库类型和版本分别是?

源端:mysql 8.0
目标端:oceanbase 4.2.3

实际测试没有问题,请在oms元数据库的rm库中查询报错sql
select id, topic, subtopic, topic_type, store_type, url, mode, mode_num, white_list, black_list, related_groups, config, gmt_create, gmt_modified from store_topic where related_groups =’{projectid}’;

再拼装成下面的sql,执行看看是否报错
select id, topic, subtopic, topic_type, store_type, url, mode, mode_num, white_list, black_list, related_groups, config, gmt_create, gmt_modified from store_topic
where
related_groups = ‘np_5q4g6dvwmda8’
AND topic_type = ‘MYSQL’
AND store_type = ‘CRAWLER’
AND mode = ‘UN_SHARE’
AND url = ‘jdbc:mysql://100.88.109.129:3310?useUnicode=true&characterEncoding=utf8&allowLoadLocalInfile=false&autoDeserialize=false&allowLocalInfile=false&allowUrlInLocalInfile=false&useSSL=false&allowPublicKeyRetrieval=true’
AND white_list = ‘ftsp_product.*’
AND black_list = ‘ftsp_product.ftsp_fp_common|ftsp_product.ftsp_kh_pg|ftsp_product.ftsp_rjz_yctq_task|ftsp_product.ftsp_infra_pzmbxx|ftsp_product.ftsp_kh_pg_user|ftsp_product.ftsp_api_mq_request_log|ftsp_product.ftsp_wq_task_fwsx|ftsp_product.ftsp_infra_pzmbxx_mx|ftsp_product.ftsp_rjz_bank_dzd|ftsp_product.ftsp_fp_common_mx|ftsp_product.ftsp_ht_khfw_error|ftsp_product.ftsp_kh_tyxx_hsxx|ftsp_product.ftsp_kh_tyxx_log|ftsp_product.ftsp_sb_account_requirement|ftsp_product.ftsp_kh_qyz_glqr|ftsp_product.ftsp_ht_hsxx|ftsp_product.ftsp_wq_fwsx|ftsp_product.csp_delivery_error_htxx|ftsp_product.ftsp_wq_task_bslc|ftsp_product.ftsp_kh_fwda_qylxr|ftsp_product.ftsp_rjz_bank_dzd_common|ftsp_product.ftsp_wq_task|ftsp_product.ftsp_zt_ztxx|ftsp_product.srep_mo_mysql_rep_heartbeat_for_satp|ftsp_product.ftsp_kh_jcxx|ftsp_product.ftsp_kh_tyxx|ftsp_product.ftsp_sb_sbgjj_config|ftsp_product.ftsp_infra_bank_modal_mx|ftsp_product.ftsp_chjj_chxx|ftsp_product.dm_bi_csp_kh_tag|ftsp_product.ftsp_kh_khswxx|ftsp_product.ftsp_wq_task_user|ftsp_product.ftsp_infra_bank_modal|ftsp_product.ftsp_kh_cjxx|ftsp_product.ftsp_kh_gmjl|ftsp_product.ftsp_kh_fwda_khpj|ftsp_product.ftsp_zt_ywxx’
;

确实是ob的问题,

我的oms ob版本是,4.2.1。

麻烦看下ob的具体版本号是多少,select * from __all_server;

麻烦按以下方法获取下observer.log 日志

  1. 登录系统租户,打开enable_rich_error_msg 参数
    alter system set enable_rich_error_msg=true;
    
    1. 登录业务租户,执行报错 SQL 语句,会直接返回执行节点 IP 和 trace_id 信息。
    例如:
    obclient [test]> select count(*) from t2;
    ERROR 1146 (42S02): Table 'test.t2' doesn't exist
    [xx.xx.xx.1:2882] [2024-04-13 20:10:20.292087] [YB420BA1CC68-000615A0A8EA5E38-0-0]
    
    1. 去 xx.xx.xx.1 节点过滤日志,如果最新日志无法过滤到,可以正则匹配多个日志进行过滤
    [root@x.x.x.1 ~]$ grep "YB420BA1CC68-000615A0A8EA5E38-0-0"  rootservice.log
    [root@x.x.x.1 ~]$ grep "YB420BA1CC68-000615A0A8EA5E38-0-0"  observer.log
    
    1. 获取完日志信息后,关闭enable_rich_error_msg参数
    alter system set enable_rich_error_msg=false;
    

版本号:

执行:

observer.log (21.2 KB)

应该我们这边升级一下版本就可以了~

内部看了下类似的问题OB4.2.1.5版本修复了,可以升级到这个版本观察下。