ocp部署问题

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】
【 使用版本 】4.2.1 社区版
【问题描述】清晰明确描述问题
请问我部署ocp 4.2.1 社区版,显示启动ocp-server成功,但是health check 是失败的,日志也有报错,如第一、二两张图
我访问ocp确是可以访问的,如第三、四、五三张图,请问这是怎么回事,我现在的ocp是不是有什么组件还没有启动,相关日志已上传,请帮忙看下谢谢
obd.log (100.7 KB)





目前ocp可以正常使用嘛?
可以obd cluster start ocp_name 试试看有什么结果。
启动后再发下obd.log日志。

目前ocp可以正常使用,我还接管了两套OB集群,
现在我尝试 重启 却 起不来了,这个报错好奇怪啊,我部署了ocp肯定就有了这两个租户了,重启怎么说已存在,难道不应该存在吗,那这样我之前那的metadb和monitordb的数据不就没了吗


obd.log (21.0 KB)

加个这个参数 --skip-create_tenant 试试。

加了这个参数不报租户已存在的错误了,还是报刚开始部署的错,start ocp-server ok,但是program health check 会报错,但是ocp可以正常使用,所以ocp应该是没问题的,不知道这个程序健康检查是检查的什么,相关日志已上传




obd.bak.log (209.3 KB)

看报错是有大量 socket.timeout 超时问题,可以确认下网络稳定性问题。
如果使用的是虚拟机有可能是启动初始化导致检查失败,之前应该是初始化完成了不影响使用。
历史项目中有用户使用性能较差的虚拟机出现过类似问题,可以参考下。