【 使用环境 】生产环境
【 OB or 其他组件 】OCP
【 使用版本 】4.2.2
【问题描述】OCP部署失败提示ocp-server-ce program health check e[K[ERROR] failed to start 10.211.118.38 ocp-server-ce
【复现路径】问题出现前后相关操作
【附件及日志】
【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!
【 使用环境 】生产环境
【 OB or 其他组件 】OCP
【 使用版本 】4.2.2
【问题描述】OCP部署失败提示ocp-server-ce program health check e[K[ERROR] failed to start 10.211.118.38 ocp-server-ce
【复现路径】问题出现前后相关操作
【附件及日志】
【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!
麻烦提供一份obd的日志~/.obd/log。及该集群的yaml文件 ~/.obd/cluster/xxxx/
重新部署一遍,如果还报错obd cluster start xxxx -c ocp-server-ce单独启动试试。obd版本是多少 老版本obd存在这个问题启动ocp超时导致部署失败问题。可以考虑升级到最新版3.6/
学习下
我是用的obd web部署的
而且我重新部署的时候他提示集群名称已存在,我如何继续部署呢
检查之前是否部署成功了,如果没成功删掉 ~/.obd/clsuert/xxxx目录
root@ocp:~/.obd/cluster# obd cluster start master -c ocp-server-ce
Get local repositories ok
Search plugins ok
Load cluster param plugin ok
Open ssh connection ok
Check before start ocp-server ok
[ERROR] ocp-server-ce-py_script_start-4.2.1 RuntimeError: (4012, ‘Get Location Cache Fail’)
[ERROR] ocp-server-ce start failed
See https://www.oceanbase.com/product/ob-deployer/error-codes .
Trace ID: cce6903c-c38d-11f0-8c37-fa163eab68ef
If you want to view detailed obd logs, please run: obd display-trace cce6903c-c38d-11f0-8c37-fa163eab68ef
报这个错
obd display-trace cce6903c-c38d-11f0-8c37-fa163eab68ef 提供一下日志看看
我现在重新安装提示[ERROR] OBD-4366: There is not enough memory. (Avail: 8356M, need: 12288M)
我OCP的服务器内存是64G的呢
配置都是默认的
可用内存不足了。是不是其他进程占用了
free -g看下
都没用啊
ocp和ob都在一个节点上么。
没有啊,ob是在另外三台服务器上
ocp有一套自己的metadb,可能是另外三台内存不够。