ob start 报错

剑卒 · 2022 年11 月 24 日 19:18

有能看到你的源代码的链接

先华为后天 · 2022 年11 月 24 日 19:25

啥意思？没看明白

剑卒 · 2022 年11 月 24 日 19:57

之前的报错的确是system_memory没有设置。重新部署启动出错的日志有吗？

先华为后天 · 2022 年11 月 24 日 20:09

log.tar.gz (6.5 MB)
又重新部署的日志

先华为后天 · 2022 年11 月 28 日 12:42

obd_log.gz.rar (467.0 KB)

obd日志

先华为后天 · 2022 年11 月 29 日 09:19

还有大佬帮看看不 @谐云 @宁封 @剑卒 @简葵

简葵 · 2022 年11 月 29 日 14:12

clog盘满的是哪台机器？

简葵 · 2022 年11 月 29 日 14:18

看起来启动后集群不是很正常；部署之后有没有确认过集群普通的增删改成是否正常？

先华为后天 · 2022 年11 月 29 日 16:34

集群都起不来咋测试增删改，目前看每个rs的data路径都是几个T

简葵 · 2022 年11 月 30 日 14:16

能否把启动时的报错发一下；

简葵 · 2022 年11 月 30 日 14:40

我看了一下，启动是就占了8T，大概率是配置的原因，yaml文件发一下；

简葵 · 2022 年11 月 30 日 14:52

看datafile_disk_percentage 和datafile_size这2个配置项的大小；

先华为后天 · 2022 年11 月 30 日 15:31

我觉得无论2个disk参数设置如何，都不应该在初始化集群后就占那么多空间。空间占用只是一个问题，现在主要问题obd cluster start报错：
Connect to observer x
[ERROR] OBD-1006: Failed to connect to oceanbase-ce
这一步是做的什么操作？

参数文件：
deploy.txt (1.7 KB)
磁盘大小： /dev/sdb1 21T 11T 11T 49% /oradata

另外吐槽下论坛上传文件类型限制，每次下载了文件都得要处理下才能传上来

简葵 · 2022 年11 月 30 日 16:00

你把data盘和clog盘放在一起了吧；
看一下observer启动目录下log_disk_percentage配置项的值，如果是90，改小再重新部署吧；

简葵 · 2022 年11 月 30 日 16:04

log_disk_size配置了吗？如果没配log_disk_size，是使用log_disk_percentage的默认值的：
DEF_INT(log_disk_percentage, OB_CLUSTER_PARAMETER, “0”, “[0,99]”,
“the percentage of disk space used by the log files. Range: [0,99] in integer;”
“only effective when parameter log_disk_size is 0;”
“when log_disk_percentage is 0:”
" a) if the data and the log are on the same disk, means log_disk_percentage = 30"
" b) if the data and the log are on the different disks, means log_disk_perecentage = 90",
ObParameterAttr(Section::LOGSERVICE, Source::DEFAULT, EditLevel::DYNAMIC_EFFECTIVE));

简葵 · 2022 年11 月 30 日 16:04

请问你启动的yaml文件是4.0的yaml示例文件吗？看起来不太像，建议用obd中的4.0示例文件，避免踩一些基础配置的坑；

简葵 · 2022 年11 月 30 日 16:05

3.x和4.0的yaml是不通用的，不要用3.x的yaml启动4.x的集群；

先华为后天 · 2022 年11 月 30 日 16:10

感谢，log_disk_percentage配置后可以了，另外还有个问题 ,obd cluster list 显示的那些已经destroy的集群信息如何清理？

先华为后天 · 2022 年11 月 30 日 16:11

这个集群文件原来部署过3.1.2 是没问题的，想试试4.0

obyl · 2022 年11 月 30 日 16:20

log_disk_percentage是百分比控制的。推荐还是使用log_disk_size。

destroy的集群可以直接rm -fr 那个path