OCP 接管集群 ,出现 “无法找到端口号是2882的 observer 进程” 的错误

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】
【 使用版本 】社区版OB 4.0.0,OCP V4.0.0_CE_BP1
【问题描述】OCP 接管集群,出现 “无法找到端口号是2882的 observer 进程” 的错误


截图中的6887 对应的是 2882 端口
端口号是有的

【附件】

是已经接管了吗?

应该是接管过程中, 出现的错误, 对吧.
如果是接管过程中, 出现的错误, 建议使用obd 做一个预检查, 推荐参考文档 【SOP 系列 07】如何使用 OCP 接管 OBD 部署的 OceanBase 集群

OBD 检测 这台服务器没问题 你给的这个链接我之前看了

可以找下报错接口对应的traceId,然后根据traceId找一下ocp的日志,也找一下失败的目标主机上的ocp-agent的日志,/home/admin/ocp-agent/log/mgragent.log

:joy:我这边没有这个日志
image

先根据请求的traceId看下ocp.log,ocp-agent 的log在observer的主机上

1、我这边报错 是接管的时候检测报错,没看到 traceId ;
2、ocp.log 这个日志一直再跑 我没登陆 里面啥也没有 也在跑

就是接管的时候看页面的请求



没发现啥问题

OCP 是在dockers 中安装的,我要接管的集群是在 服务器直接装的,我访问端口正常,但是OCP访问不到,有没有可能是容器和服务器的端口不互通呢

grep ‘16e…e’ 这个traceId的日志呢,看下具体检查的时候哪里报出来的问题,另外不通过的那个observer主机上有agent的日志,也可以看下mgragent.log里面有没有报错信息

容器中访问物理机上的端口应该没问题的

我把 obagent prometheus grafana 这三个都关了 有影响吗

我看你上面说 主机上有agent的日志 和 obagent 有关系吗

没有影响,ocp接管的时候会安装ocp-agent的,现在看截图里不通过的机器是已经添加到ocp了吗,如果通过添加主机添加进去了的话应该已经部署好了ocp-agent

还是要找一下日志才好看下问题

image
ocp-agent是截图这个吗
我这边的确没找到
OCP这个 我不准备弄了 就先这样吧 谢谢您 辛苦了

是图中的这个