重启ob失败

【 使用环境 】测试环境
【 OB or 其他组件 】OB
【 使用版本 】4.3.5.3
【问题描述】在mac下使用docker安装ob镜像,使用docker run命令启动成功,但是重启失败,开始检查为ip变更导致,后续重新安装ob并且固定ip后,重启还是失败
【复现路径】问题出现前后相关操作
【附件及日志】

ERROR 2002 (HY000): Can't connect to OceanBase server on '127.1' (115)
ERROR 2002 (HY000): Can't connect to OceanBase server on '127.1' (115)
ERROR 2002 (HY000): Can't connect to OceanBase server on '127.1' (115)
ERROR 2002 (HY000): Can't connect to OceanBase server on '127.1' (115)
ERROR 2002 (HY000): Can't connect to OceanBase server on '127.1' (115)
ERROR 2002 (HY000): Can't connect to OceanBase server on '127.1' (115)
Get local repositories ok
Load cluster param plugin ok
Cluster status check ok
[WARN] OBD-1011: (127.0.0.1) The recommended value of fs.aio-max-nr is 1048576 (Current value: 65536)
[WARN] OBD-1007: (127.0.0.1) The recommended number of core file size is unlimited (Current value: 0)
[WARN] OBD-1007: (127.0.0.1) The recommended number of stack size is unlimited (Current value: 8192)
[WARN] OBD-1017: (127.0.0.1) The value of the "vm.max_map_count" must be within [327600, 1310720] (Current value: 262144, Recommended value: 655360)
[WARN] OBD-1017: (127.0.0.1) The value of the "vm.overcommit_memory" must be 0 (Current value: 1, Recommended value: 0)
[WARN] OBD-1017: (127.0.0.1) The value of the "fs.file-max" must be greater than 6573688 (Current value: 811792, Recommended value: 6573688)
[WARN] OBD-2000: (127.0.0.1) not enough memory. (Free: 6G, Need: 6G)
cluster scenario: express_oltp
Start observer ok
observer program health check x
[WARN] OBD-2002: Failed to start 127.0.0.1 observer
See https://www.oceanbase.com/product/ob-deployer/error-codes .
Trace ID: b3ccf55a-9b74-11f0-82ff-dab4dbf21d57
If you want to view detailed obd logs, please run: obd display-trace b3ccf55a-9b74-11f0-82ff-dab4dbf21d57
Sat Sep 27 07:36:41 UTC 2025
check tenant connectable
boot failed!

@论坛小助手

1 个赞

推荐使用 obdiag 工具进行日志采集,并且将采集到的日志提供给我们以便确认问题所在。
日志采集场景: 集群无法连接
日志采集命令: obdiag gather scene run --scene=observer.cluster_down

为了确定具体的问题,在此需要您提供一些信息:

  1. 您在使用 docker run 命令启动 OceanBase 时,是否指定了任何与网络相关的参数?例如 -p 来映射端口或 --network 来指定网络?
  2. 在重启失败的情况下,您可以尝试通过 docker ps -a 查看容器的状态,同时使用 docker logs <container_id> 查看容器的日志输出,这些日志中是否有其他错误提示?
  3. 您是否在 docker-compose.yml 文件或其他配置文件中进行了自定义设置,如果有,请提供相关的配置信息。
  4. 您能否提供更详细的重启失败时的报错信息?
  5. 您是否尝试过在 Docker 容器内直接访问 OceanBase 服务,例如通过 telnetmysql -h127.0.0.1 -P2881 -u<username> -p<password> 来验证连接?
  6. 您使用的 Docker 版本是多少?您在 Mac 上使用的 Docker 环境是什么(例如 Docker Desktop for Mac)?

请按照上述命令收集日志,并根据您的情况回答上述问题,以便我们能够更好地帮助您解决问题。

附上敏捷诊断工具 obdiag 使用帮助链接

2 个赞

日志不全啊

1 个赞

free内存不足,看起来机器剩余内存不足了

1 个赞