OCP部署失败提示ocp-server-ce program health check [ERROR] failed to start 10.211.118.38 ocp-server-ce

【 使用环境 】生产环境
【 OB or 其他组件 】OCP
【 使用版本 】4.2.2
【问题描述】OCP部署失败提示ocp-server-ce program health check e[K[ERROR] failed to start 10.211.118.38 ocp-server-ce
【复现路径】问题出现前后相关操作
【附件及日志】

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

1 个赞

麻烦提供一份obd的日志~/.obd/log。及该集群的yaml文件 ~/.obd/cluster/xxxx/

2 个赞

obd.txt (555.6 KB)
inner_config.txt (167 字节)
config.txt (2.2 KB)
下面两个是yaml文件,传不了yaml,改了后缀

1 个赞

重新部署一遍,如果还报错obd cluster start xxxx -c ocp-server-ce单独启动试试。obd版本是多少 老版本obd存在这个问题启动ocp超时导致部署失败问题。可以考虑升级到最新版3.6/

2 个赞

学习下

我是用的obd web部署的

而且我重新部署的时候他提示集群名称已存在,我如何继续部署呢

检查之前是否部署成功了,如果没成功删掉 ~/.obd/clsuert/xxxx目录

root@ocp:~/.obd/cluster# obd cluster start master -c ocp-server-ce
Get local repositories ok
Search plugins ok
Load cluster param plugin ok
Open ssh connection ok
Check before start ocp-server ok
[ERROR] ocp-server-ce-py_script_start-4.2.1 RuntimeError: (4012, ‘Get Location Cache Fail’)
[ERROR] ocp-server-ce start failed
See https://www.oceanbase.com/product/ob-deployer/error-codes .
Trace ID: cce6903c-c38d-11f0-8c37-fa163eab68ef
If you want to view detailed obd logs, please run: obd display-trace cce6903c-c38d-11f0-8c37-fa163eab68ef

报这个错

obd display-trace cce6903c-c38d-11f0-8c37-fa163eab68ef 提供一下日志看看

新建 文本文档.txt (18.1 KB)

我现在重新安装提示[ERROR] OBD-4366: There is not enough memory. (Avail: 8356M, need: 12288M)
我OCP的服务器内存是64G的呢
配置都是默认的

可用内存不足了。是不是其他进程占用了
free -g看下

都没用啊

ocp和ob都在一个节点上么。

没有啊,ob是在另外三台服务器上

ocp有一套自己的metadb,可能是另外三台内存不够。


另外三台服务器都是32G内存的