三节点白屏部署失败求助,最小可用也不行v4.3.5

$ obd --version
OceanBase Deploy: 3.1.1
REVISION: 94b5853a18ad1ad09d5afc30d9edb44643dd488c
BUILD_BRANCH: HEAD

机器信息(三节点一致)
$ free -g
total used free shared buff/cache available
Mem: 251 2 245 0 3 247
Swap: 3 0 3

/data1有2T可用空间

obd.rar (40.1 KB)
observer.rar (59.2 KB)
yaml.rar (867 字节)

部署结束只有一个进程:/data1/fff/ob/myob435/oceanbase/bin/observer -r

4 个赞

@Giant 这里

3 个赞

你机器的磁盘是机械盘么

3 个赞

$ lsblk -d -o name,rota
NAME ROTA
sda 1
sdb 1
sdc 1
是机械硬盘

3 个赞

你的yaml文件好像没内容,麻烦再发一份。bootstrap集群初始化失败,一般跟资源配置或者磁盘性能有关

3 个赞

我刚下载 yaml.rar 看了,没有问题啊
再发一次
yaml.rar (867 字节)

3 个赞

内存给高点再试一下给个50G,三节点给6G太低了。

3 个赞

最大、最小、自定义都会失败呢

3 个赞

10.50.160.127
10.50.160.125
10.50.160.124 这三台 机器内存都是 250G的吗 ??? 您是依据那篇文档进行部署的 ,您发下

4 个赞

[2025-03-04 19:02:28.656346] WDIAG [RPC] post (ob_poc_rpc_proxy.h:235) [38922][T1_TimerWK0][T1][YB420A32A07C-00062F802DB7C6B4-0-0] [lt=0][errcode=-4122] check_blacklist failed(addr=“10.50.160.127:2882”)
日志中显示有节点被拉入黑名单了,应该通信有问题的。可以检查下防护墙,端口冲突,网络延迟之类的。

3 个赞

memory_limit: 30G
datafile_size: 20G
system_memory: 5G
log_disk_size: 20G

这几个值在这个不分 也都改下。

3 个赞

image
这个查看详情 也有 错误 内容 也可以发出来看下。

1 个赞

124:
$ free -g
total used free shared buff/cache available
Mem: 251 2 248 0 0 247
Swap: 3 0 3

125:
$ free -g
total used free shared buff/cache available
Mem: 251 2 248 0 0 247
Swap: 3 0 3

127:
$ free -g
total used free shared buff/cache available
Mem: 251 2 248 0 0 247
Swap: 3 0 3

部署方式就是obd web,选择最小占用方式,几乎没有自定义参数

还有你截图想看obd web的页面报错,这个时间窗口很短,大部分我看到失败的时候,odb web已经退出了

2 个赞

只能说很离谱,我不认为有这样的问题

1 个赞

您这次在尝试下 , 看着您的机器配置, 最大可用模式试下 ,看看有没有参数配置的 。

然后再 最小可用看看 有没有参数配置的

https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000002016072

2 个赞

这套配置的报错:
memory_limit: 30G
datafile_size: 20G
system_memory: 5G
log_disk_size: 20G

obd.rar (22.0 KB)
observer.rar (84.2 KB)
yaml.rar (813 字节)
另外,obd web的报错获取到了
web报错.rar (20.3 KB)

1 个赞

obd cluster list
obd cluster display 集群名字 ; – 能看到的所有集群名字都看下

ps -ef| grep observer 三个observer 上看下

1 个赞

image
https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000002016074

这些 都做了 吧。

2 个赞

$ obd cluster list
myob435 deployed

$ obd cluster display myob435
Deploy “myob435” is deployed
See https://www.oceanbase.com/product/ob-deployer/error-codes .
Trace ID: 90ff7ed8-f9a0-11ef-9f29-2c9d1e2cbdd8
If you want to view detailed obd logs, please run: obd display-trace 90ff7ed8-f9a0-11ef-9f29-2c9d1e2cbdd8

3个节点都是这样

2 个赞

白屏部署不是有预检查吗

1 个赞