OceanBase白屏集群部署一直卡在 Initialize oceanbase-ce

【 使用环境 】测试环境
【 OB or 其他组件 】all-in-one
【 使用版本 】4.2.2
【问题描述】OceanBase白屏集群部署一直卡在 Initialize oceanbase-ce
【复现路径】使用白屏安装,预检全部通过,但是进行到Initialize oceanbase-ce就会卡住,反复多次安装都卡在这里
【附件及日志】 百度网盘 请输入提取码 提取码: u29y

1 个赞

如果日志过大,可以压缩切分的方式发一下

1 个赞


文件有100MB, 用那个一键诊断工具生成的

1 个赞


看.obd下的日志,每次都卡在这里

限制是500M,这个压缩包是100M,能否直接上传这个文件呢。我们不能用百度网盘

麻烦发下配置文件。
安装时可以看下软硬件要求,和部署前的环境部署是否有操作?

传不上来,报错截图提示限制是500MBKB,不知道到底是多少,但100MB确实报错无法提交

感谢回复,请问你需要的配置文件一般在哪个路径下? 上面链接的软硬件要求和环境配置都有处理过,预检全部通过
服务器是三台4C16G的 linux, 每台配置了200G的数据盘

可以再obd cluster edit-config name查看到。

1 个赞

那先提供下配置吧。在~/.obd/cluster/集群名/config.yaml

oceanbase_test.zip (1.9 KB)
obd.zip (41.9 KB)

配置看上去没问题,还是需要OB的日志才能看出来根本问题在哪。诊断工具一次性收集全部节点可能太多了。单独收集下172.18.0.11的日志吧。

# 这条命令将登陆到172.18.0.11上OB对应的目录下
obd tool command oceanbase_test log
# 提起boostrap日志
grep BOOTSTRAP *

没有任何输出

出现这种情况的一般都是资源不足或者资源分配不合理导致的
image
这块内容调成 5G 试一试

你这种情况:资源分配不合理。


一般是资源不合理造成的,可以把资源调大一下
memory_limit:15G
system_memory:5G
datafile:10G
log_disk_size:45G
,试试看

报错:
[ERROR] OBD-2000: (172.18.0.11) not enough memory. (Free: 11.3G, Buff/Cache: 3.7G, Need: 15.0G), Please reduce the memory_limit or memory_limit_percentage
[WARN] OBD-2000: (172.18.0.12) not enough memory. (Free: 13.3G, Need: 15.0G)
[WARN] OBD-2000: (172.18.0.13) not enough memory. (Free: 13.6G, Need: 15.0G)

机器配置是4核16G,这个内存分配有什么规则吗?我之前上传的配置是自动生成的

修改为下面的值后不报错了,但是还是卡在老地方:
memory_limit:11G
system_memory:5G
datafile:10G
log_disk_size:45G

那么我们在从配置上入手试试吧。目前最可疑的是system_memory,在配置中直接将system_memory设置为0。
集群配置下点更多配置,找到system_memory,将其设置为自定义,并输入0



这里需要注意:由于点开了更多配置,需要手动配置下devname(网卡名)

也可以简单的将部署模式改为最小可用(当前你这套配置其实跟最小可用没差多少)
image

按上面的配置或是最小可用,还是卡这个地方