ob start 报错

有能看到你的源代码的链接

啥意思?没看明白

之前的报错的确是system_memory没有设置。重新部署启动出错的日志有吗?

log.tar.gz (6.5 MB)
又重新部署的日志

obd_log.gz.rar (467.0 KB)

obd日志

还有大佬帮看看不 @谐云 @宁封 @剑卒 @简葵

clog盘满的是哪台机器?

看起来启动后集群不是很正常;部署之后有没有确认过集群普通的增删改成是否正常?

:sweat_smile: 集群都起不来咋测试增删改,目前看每个rs的data路径都是几个T

能否把启动时的报错发一下;

我看了一下,启动是就占了8T,大概率是配置的原因,yaml文件发一下;

看datafile_disk_percentage 和datafile_size这2个配置项的大小;

我觉得无论2个disk参数设置如何,都不应该在初始化集群后就占那么多空间。 空间占用只是一个问题,现在主要问题obd cluster start报错:
Connect to observer x
[ERROR] OBD-1006: Failed to connect to oceanbase-ce
这一步是做的什么操作?

参数文件:
deploy.txt (1.7 KB)
磁盘大小: /dev/sdb1 21T 11T 11T 49% /oradata

另外吐槽下论坛上传文件类型限制,每次下载了文件都得要处理下才能传上来

你把data盘和clog盘放在一起了吧;
看一下observer启动目录下log_disk_percentage配置项的值,如果是90,改小再重新部署吧;

log_disk_size配置了吗?如果没配log_disk_size,是使用log_disk_percentage的默认值的:
DEF_INT(log_disk_percentage, OB_CLUSTER_PARAMETER, “0”, “[0,99]”,
“the percentage of disk space used by the log files. Range: [0,99] in integer;”
“only effective when parameter log_disk_size is 0;”
“when log_disk_percentage is 0:”
" a) if the data and the log are on the same disk, means log_disk_percentage = 30"
" b) if the data and the log are on the different disks, means log_disk_perecentage = 90",
ObParameterAttr(Section::LOGSERVICE, Source::DEFAULT, EditLevel::DYNAMIC_EFFECTIVE));

请问你启动的yaml文件是4.0的yaml示例文件吗?看起来不太像,建议用obd中的4.0示例文件,避免踩一些基础配置的坑;

3.x和4.0的yaml是不通用的,不要用3.x的yaml启动4.x的集群;

感谢,log_disk_percentage配置后可以了,另外还有个问题 ,obd cluster list 显示的那些已经destroy的集群信息如何清理?

这个集群文件原来部署过3.1.2 是没问题的,想试试4.0

log_disk_percentage是百分比控制的。推荐还是使用log_disk_size。

destroy的集群可以直接rm -fr 那个path