OCP 告警 “OceanBase 服务器无法连接”

问题现象

使用 OCP 接管 OceanBase 集群后,告警 “OceanBase 服务器无法连接”,且集群列表中的告警信息显示停服,但实际并未停服,尝试重装 Agent、OCP 均无法解决。

环境情况

目前使用公网搭建1-1-1集群,其中2台是在内网,使用DNAT做的内网转发。还有一台使用公网IP。
目前上3台服务器均能互通,且按照https://www.oceanbase.com/knowledge-base/ocp-ee-1000000003262914这篇文章排查了127和localhost均能访问。

公网防火墙开发端口
2881-2886
3000
8080
8088-8089
9090
9093
55555
62888-62889
ICMP类型:8
ICMP类型:13
ICMP类型:14

节点 Region 外网IP 内网IP 网络特性
节点1 玉溪 14.205.xx.141 11.10.12.200 内网互通
节点2 玉溪 182.246.xx.43 10.10.12.200 内网互通
节点3 罗平 183.224.xx.154 10.100.101.200 内网不通
ocp 玉溪 14.205.xx.141:48080 11.10.12.51 内网互通

需要如何排查解决

2 个赞

需要确认ocp的节点与该异常节点是否打通。
集群信息采集是从ocp节点发送过去的,你这里显示内网不通是预期内的

2 个赞

打卡

OCP可以通的

1 个赞

这两个告警只有183这个IP吗?其它2个节点的IP有这个告警吗?

“内网不通” 是什么意思?

不在一个局域网的意思。所以集群是用的公网搭建的。
现在是OCP能ping通每个1-1-1集群的每个节点的,同时telnet 能通每个节点的2881

学习了,像是网络问题啊