ocp在新增 zone时,no route to host

【 使用环境 】
测试环境

【 ocp】

【 使用版本 】
4.3.1-20240805192316

image

【问题描述】
集群新增 zone时报错:
Unhandled exception, type=HttpConnectFailedException, message=connect to agent failed, NoRouteToHostException: No route to host (Host unreachable)

【复现路径】
暂无

日志信息:

这一块 显示的 servers不是我新增的 ip地址,且api接口使用的是 batchadd,但是官网新增zone使用的接口是POST /api/v2/ob/clusters/{id}/zones

官网的接口信息:


https://www.oceanbase.com/docs/common-ocp-1000000001127255

目前 ocp的容器跟新增zone内的服务器网络是没有问题的

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

根据您提供的信息,当您在 OCP 上尝试新增 Zone 时遇到了 No route to host (Host unreachable) 错误。这通常意味着 OCP 无法通过网络到达目标主机。以下是几个可能的原因及解决方法:

  1. 网络连接问题

    • 检查网络连通性:确保 OCP 服务器与目标主机之间的网络是连通的。您可以尝试从 OCP 服务器 ping 目标主机的 IP 地址,确认网络是否可达。
    • 检查防火墙设置:确保目标主机上的防火墙允许来自 OCP 服务器的连接。您可以临时关闭防火墙进行测试,或者检查防火墙规则,确保必要的端口是开放的。
  2. 主机配置问题

    • 检查主机状态:确保目标主机已经启动并且正常运行。您可以登录目标主机,检查其状态。
    • 检查 SSH 服务:确保目标主机上的 SSH 服务已经启动并且可以接受连接。您可以尝试从 OCP 服务器通过 SSH 连接到目标主机,确认 SSH 服务是否正常。
  3. OCP Agent 问题

    • 检查 OCP Agent 状态:确保目标主机上已经安装并启动了 OCP Agent。您可以登录目标主机,检查 OCP Agent 的状态。
    • 重启 OCP Agent:如果 OCP Agent 未启动或状态异常,您可以尝试重启 OCP Agent。具体操作可以参考文档中的相关内容 [2], [3]
  4. 主机与 OCP 服务器的时间同步问题

    • 检查时间同步:确保目标主机与 OCP 服务器之间的时间同步。时间差异过大可能导致认证失败等问题。您可以使用 NTP 服务进行时间同步。
  5. 主机凭证问题

    • 检查凭证配置:确保 OCP 服务器上有正确的凭证配置,以便能够通过 SSH 访问目标主机。您可以检查 OCP 服务器上的凭证配置,确保凭证是正确的。
  6. 主机与 OCP 服务器不在同一网络

    • 检查网络配置:如果目标主机与 OCP 服务器不在同一网络,确保外部访问 OCP 的系统参数 ocp.site.url 已经正确设置。您可以参考文档中的相关内容进行设置 [8]

如果您已经尝试了上述方法但问题仍然存在,建议您联系 OceanBase 的技术支持团队,获取进一步的帮助和支持。希望这些信息对您有所帮助!

检索到的文档如下:

  1. 扩展 OceanBase 集群及租户的高可用
  2. 重启主机的 OCP Agent 的基础进程
  3. 重启主机的 OCP Agent 的工作进程
  4. OCP 服务健康监测
  5. 修改 Zone
  6. 新增 Zone
  7. 新增副本
  8. 主机管理常见问题
  9. 通过 OBD 白屏部署 OceanBase 集群

麻烦先按照小助手的建议排查下

1.OCP 服务器与目标主机之间网络连接问题

2.OCP 服务器与目标主机之间的时间同步问题

3.ocp.site.url 已经正确设置

集群拓扑是什么样的,是单机的吗

这个问题有进展吗