集群启动失败,ocp-express无法启动

【 使用环境 】
生产环境
【 OB or 其他组件 】
ocp-express
【 使用版本 】
4.1.0
【问题描述】
集群无法启动,ocp-express启动失败。查看ocp-express的日志发现,要设置ob_query_timeout,在ocp租户下设置好后,依旧无法启动集群,还是报同样的错误。
【复现路径】

【问题现象及影响】

【附件】
bootstrap.log (136.5 KB)
obd.log (1.5 MB)

ocp-express.log的日志有吗

ocpexpress的log目录下没有ocp-express.log,只有bootstrap.log

Caused by: java.sql.SQLNonTransientConnectionException: (conn=1048643) Connection timed out

看后面的报错是连接的时候就超时了,这个时候 observer 还正常吗,建集群的时候分配的资源是什么样的呢

用OBD白屏部署的,给的运行所需的最小资源

选的最小规格部署吗,可以调整的大一些吗,机器的实际资源够吗

可以sys租户下执行 select * from __all_unit_config;
看看吗?

是够的,那我调大些试一下

是这个情况,有什么问题吗

你稍微调大一点ocp_unit的资源,看看是否能启动ocp-express;如果失败的话,把observer.log的日志也发一下

我把ocp_unit的cpu由一个调到了3个,但还是失败了


另外,我没找到observer.log
1681376397648

observer.log 在 oceanbase 的 home 目录下呢

有点大啊 200M,能在社区里发出去吗

我这边先看看日志