普通用户部署oceanbase单节点集群报错-ConnectionRefusedError: [Errno 111] Connection refused

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】生产环境
【 使用版本 】oceanbase-all-in-one-4.3.5_bp5_hf2
【问题描述】

  • 使用普通用户ocadmin部署oceanbase集群单节点;新建的用户,赋予了sudo 免密权限。
  • 部署时就不能成功
    【复现路径】问题出现前后相关操作
    【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

提供一下 yaml参数文件和observer日志

image

配置无论自定义配置;还是最小化安装都是报错,如下是app.log
app.log (1023.9 KB)

你在部署节点连一下数据库试试
mysql -h192.168.20.10 -P2881 -uroot@sys -p -Ac

obd.log (680.7 KB)
obd log。
之前都是使用root用户直接部署的,没有出现过问题。使用普通用户就不行,很奇怪。

这个节点访问ob节点是不是没打通端口什么的
ps -ef|grep observer看下进程在么
发一份observer日志看下
~/myoceanbase/oceanbase/log

1.ob和obd 在同一个节点,ocadmin 普通用户还做了自己免密到自己。
2.进程在的,端口也在

observer.log.tar.gz (20.4 MB)

没有覆盖到ob启动期间的日志,存在大量查询内部表报错5019问题。
应该是启动初始化异常导致内部系统表创建失败。重新部署一遍如果还是报错,提供一份涵盖部署期间的observer日志

observer.log.20260413162347440.tar.gz (25.1 MB)


最早的日志,看看能不能看到问题。不行的话,我再重新部署一下。

需要重新bootstrap一下,建议直接重新部署obd执行redeploy。
memory_limit给大点 6G太小了

好的,我试试

能把rootservice.log日志也发一下 时间为16:46的那个observer.log日志也发一下
从日志信息看observer应该是没有初始化完
[2026-04-13 16:00:58.582702] WDIAG [SQL] create_sessid (ob_sql_session_mgr.cpp:411) [463675][T1_TimerWK0_ReqMemEvict][T1][Y0-0000000000000000-0-0] [lt=51][errcode=0] server is initiating(server_index=0, local_seq=15, max_local_seq=262143, max_server_index=4095)


我使用虚拟机同样的系统,同样的操作,也是普通用户部署的,一遍成功。

再次核查了20.10 物理机,也是符合要求的:

我重新部署一下试试。。°(°¯᷄◠¯᷅°)°。

sorry,我redeploy中,日志被覆盖了。我先看看情况 :joy:
obd cluster redeploy myoceanbase


重新redeploy ,发现报错,CPU 架构不支持???是吗


@辞霜 @淇铭

observer.log.tar.gz (12.6 MB)

cluster heartbeat rpc failed, tenant_id=1", warnings:[]}, tenant_id_=1, dst=“192.168.20.10:2882”, cluster_service_tablet_id={id:226}
心跳rpc超时,存在连通性问题。还是机器导致,防火墙关掉了么

1 个赞