4.1白屏部署在centos和rocky失败

【 使用环境 】生产环境 or 测试环境
测试环境
【 OB or 其他组件 】
oceanbase社区版本,白屏部署组件全安装
【 使用版本 】
OceanBase社区版本4.1.0-ce,4.1.0-ce-bp2
【问题描述】清晰明确描述问题
部署时,obproxy部署失败,进一步导致ocp部署失败
【复现路径】问题出现前后相关操作
数据节点系统为centos7或rocky9部署失败,麒麟可以正常部署
【问题现象及影响】
obproxy部署失败,部署完后,单独-c启动obproxy服务,显示服务启动失败,但实际2883端口已可以访问到代理,再次启动obproxy服务显示端口占用。ocp使用代理服务,导致整个ocp无法部署

【附件】

请稍等,已咨询相关同学

这里有我们系统支持列表:OceanBase 社区
目前看rocky9不在目前列表里面,centos7 是支持的。
centos7解决方案:
1、由于当前obproxy的状态和obd 里面记录的不一致。需要先清理环境 :obd cluster destory {deployname} -f
2、重新通过白屏部署

3、如果还有问题 请上传obd的log问题 路径在:~/.obd/log/obd

obd.txt (1.0 MB)

我每次部署失败后都是obd cluster destory的

根据日志考虑 是因为机器性能问题 obd在20s内没有监测到obproxy启动认为启动失败了。建议通过修改插件的形式 增加超时时间再清理环境重新试一下:
vi ~/.obd/plugins/obproxy-ce/3.1.0/start.py

我看之前也有人反应过类似的问题,我修一下超时时间试一下

可以了,感谢

好的,我们会在下一个版本里面增大这个超时时间。

我这边部署也是这样的问题。我的机器是24核32G内存,应该不存在性能问题。
但是为啥20秒还没启动成功?不是应该优化启动时间吗?

感觉和系统有关系,同一台机器,我用centos就会超时,用麒麟就不会

这里的性能还和磁盘有关系 以及配置文件里面给proxy的配置有关

目前我们在普通的测试机器上测试的时间obproxy启动时间都在10s以内

还有启动obproxy时 iops 占用 内存 cpu占用 等因素