ocp-server-ce 检查不通过

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】
【 使用版本 】
【问题描述】ocp-server-ce program health check 检查不通过,耗费时间过长
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)


社区版都这样吗?没有详细日志?

再集群配置里得


手动设置下参数呢。

我先使用obd 部署了数据库,租户都创建好了 。

服务器从16G内存 换成 32G内存都不好用。 这个错误,还不知道是什么 原因导致的,没有日志

版本是多少呢

~/.obd/log/obd完整日志 麻烦提供下

[2024-04-16 09:43:40.299] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – exited code 0
[2024-04-16 09:43:40.300] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – failed to start 192.168.10.16 ocp-server-ce, remaining retries: 37
[2024-04-16 09:43:55.315] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – 192.168.10.16 program health check
[2024-04-16 09:43:55.315] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – admin@192.168.10.16 execute: ls /proc/26755
[2024-04-16 09:43:55.328] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – exited code 0
[2024-04-16 09:43:55.328] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – admin@192.168.10.16 execute: bash -c ‘cat /proc/net/{tcp*,udp*}’ | awk -F’ ’ ‘{print $2,$10}’ | grep ‘00000000:1F90’ | awk -F’ ’ ‘{print $2}’ | uniq
[2024-04-16 09:43:55.383] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – exited code 0
[2024-04-16 09:43:55.383] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – failed to start 192.168.10.16 ocp-server-ce, remaining retries: 36
[2024-04-16 09:44:10.398] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – 192.168.10.16 program health check
[2024-04-16 09:44:10.398] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – admin@192.168.10.16 execute: ls /proc/26755
[2024-04-16 09:44:10.411] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – exited code 0
[2024-04-16 09:44:10.411] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – admin@192.168.10.16 execute: bash -c ‘cat /proc/net/{tcp*,udp*}’ | awk -F’ ’ ‘{print $2,$10}’ | grep ‘00000000:1F90’ | awk -F’ ’ ‘{print $2}’ | uniq
[2024-04-16 09:44:10.465] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – exited code 0
[2024-04-16 09:44:10.466] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – failed to start 192.168.10.16 ocp-server-ce, remaining retries: 35


这个方法不好使。 我这还是不行。

杀掉后,重启。 后面还是报错这个



提个下完整的obd日志。

obd.txt (264.3 KB)
4.2.1 4.2.2 版本 都报同样的错误

obd --version 看下版本

obtest是已有集群嘛?
而ocp是像单独进行部署嘛?

obtest 当做ocp 的meta database

能确定是程序的问题还是部署的问题不 ???

/home/admin/logs/ocp-server.log

可以看下这个日志里报的是什么错误

如果都准备好了的话,参考这个文档直接起镜像可以吗
https://www.oceanbase.com/docs/common-ocp-1000000000584988