【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】
【 使用版本 】
【问题描述】ocp-server-ce program health check 检查不通过,耗费时间过长
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):
【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)
【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】
【 使用版本 】
【问题描述】ocp-server-ce program health check 检查不通过,耗费时间过长
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):
【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)
社区版都这样吗?没有详细日志?
我先使用obd 部署了数据库,租户都创建好了 。
服务器从16G内存 换成 32G内存都不好用。 这个错误,还不知道是什么 原因导致的,没有日志
版本是多少呢
~/.obd/log/obd完整日志 麻烦提供下
[2024-04-16 09:43:40.299] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – exited code 0
[2024-04-16 09:43:40.300] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – failed to start 192.168.10.16 ocp-server-ce, remaining retries: 37
[2024-04-16 09:43:55.315] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – 192.168.10.16 program health check
[2024-04-16 09:43:55.315] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – admin@192.168.10.16 execute: ls /proc/26755
[2024-04-16 09:43:55.328] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – exited code 0
[2024-04-16 09:43:55.328] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – admin@192.168.10.16 execute: bash -c ‘cat /proc/net/{tcp*,udp*}’ | awk -F’ ’ ‘{print $2,$10}’ | grep ‘00000000:1F90’ | awk -F’ ’ ‘{print $2}’ | uniq
[2024-04-16 09:43:55.383] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – exited code 0
[2024-04-16 09:43:55.383] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – failed to start 192.168.10.16 ocp-server-ce, remaining retries: 36
[2024-04-16 09:44:10.398] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – 192.168.10.16 program health check
[2024-04-16 09:44:10.398] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – admin@192.168.10.16 execute: ls /proc/26755
[2024-04-16 09:44:10.411] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – exited code 0
[2024-04-16 09:44:10.411] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – admin@192.168.10.16 execute: bash -c ‘cat /proc/net/{tcp*,udp*}’ | awk -F’ ’ ‘{print $2,$10}’ | grep ‘00000000:1F90’ | awk -F’ ’ ‘{print $2}’ | uniq
[2024-04-16 09:44:10.465] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – exited code 0
[2024-04-16 09:44:10.466] [4efb0d98-fb92-11ee-ab25-e0d55eea3377] [DEBUG] – failed to start 192.168.10.16 ocp-server-ce, remaining retries: 35
提个下完整的obd日志。
obd --version 看下版本
obtest是已有集群嘛?
而ocp是像单独进行部署嘛?
obtest 当做ocp 的meta database
能确定是程序的问题还是部署的问题不 ???
/home/admin/logs/ocp-server.log
可以看下这个日志里报的是什么错误