OMS全量迁移移除对象失败

【 使用环境 】测试环境
【 OB or 其他组件 】OMS
【 使用版本 】4.2.1_CE
【问题描述】OMS全量迁移时部分表数据有问题中途想移除执行失败,错误信息如下:

{
  "errCode": null,
  "errMsg": "Failed to operate all process. Failed list: [{\"taskName\":\"99.99.128.97-9000:connector_v2:np_5bvjn2vega74-full_trans-1-0:0000000001\",\"errMsg\":\"Failed to stop connectorTaskV2 99.99.128.97-9000:connector_v2:np_5bvjn2vega74-full_trans-1-0:0000000001, java.net.UnknownHostException: adsl-99-99-128-97.dsl.fyv2ar.sbcglobal.net: adsl-99-99-128-97.dsl.fyv2ar.sbcglobal.net: Name or service not known.\"}].",
  "errorDetail": {
    "code": "CM-SCHEOR000002",
    "extraContext": null,
    "level": "ERROR",
    "message": "Failed to operate all process. Failed list: [{\"taskName\":\"99.99.128.97-9000:connector_v2:np_5bvjn2vega74-full_trans-1-0:0000000001\",\"errMsg\":\"Failed to stop connectorTaskV2 99.99.128.97-9000:connector_v2:np_5bvjn2vega74-full_trans-1-0:0000000001, java.net.UnknownHostException: adsl-99-99-128-97.dsl.fyv2ar.sbcglobal.net: adsl-99-99-128-97.dsl.fyv2ar.sbcglobal.net: Name or service not known.\"}].",
    "messageMcmsContext": null,
    "messageMcmsKey": null,
    "proposal": null,
    "proposalMcmsContext": null,
    "proposalMcmsKey": null,
    "reason": null,
    "reasonMcmsContext": null,
    "reasonMcmsKey": null,
    "upstreamErrorDetail": null
  },
  "isSuccess": false,
  "result": {
    "success": [],
    "failed": [
      {
        "taskName": "99.99.128.97-9000:connector_v2:np_5bvjn2vega74-full_trans-1-0:0000000001",
        "errMsg": "Failed to stop connectorTaskV2 99.99.128.97-9000:connector_v2:np_5bvjn2vega74-full_trans-1-0:0000000001, java.net.UnknownHostException: adsl-99-99-128-97.dsl.fyv2ar.sbcglobal.net: adsl-99-99-128-97.dsl.fyv2ar.sbcglobal.net: Name or service not known."
      }
    ]
  },
  "retryable": null
}

【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(系统巡检和诊断信息收集)

Failed to stop connectorTaskV2 99.99.128.97-9000:connector_v2:np_5bvjn2vega74-full_trans-1-0:0000000001, java.net.UnknownHostException: adsl-99-99-128-97.dsl.fyv2ar.sbcglobal.net: adsl-99-99-128-97.dsl.fyv2ar.sbcglobal.net: Name or service not known.

是主机出现了什么问题吗?无法连接?

主机正常的(至少连接没问题),OMS也部署在97 这个机器上

要配置host吗

看起来是主机名字无法解析,可以直接使用IP吗?

不太明白使用IP是什么意思,我现在是全量迁移过程中有一些表是不想迁移的,表结构迁移时已经忽略了并且ob中也没有建对应的表,现在想把这部分表从全量迁移任务中删掉触发的本帖的异常,数据迁移已经接近尾声了,不是数据库连不上之类的问题。

点击移除按钮,这个操作结果实际上再全量作业配置中将这些表加入到黑名单中,可以通过:查看组件监控看到全量组件的具体配置

1 个赞

你的这条链路实际上可以不用管,因为已经报错的表全量是不会再处理了,没有报错的表也会继续迁移,本身我看链路上也没有增量链路

上面的报错可以看一下adsl-99-99-128-97.dsl.fyv2ar.sbcglobal.net这个域名是否在安装配置文件中?
如果是cm地址,可以在oms容器中/etc/host加一下

配置文件里没找到这个域名,CM确实指向了97这个机器,加了host好了 :cherry_blossom:

"cm_nodes":
- "99.99.128.97"