白屏部署失败错误怎么查看

白屏部署3节点集群的时候,部署失败,详情让执行 obd tool command ob435 log -c oceanbase-ce -s xxx 查看,执行命令之后,看到 oceanbase/log 目录下有一些文件:
alert
election.log
election.log.wf
observer.log
observer.log.20250224083724664
observer.log.20250224085253682
observer.log.20250224090820109
observer.log.20250224092347549
observer.log.20250224093916023
observer.log.wf
rootservice.log
rootservice.log.wf
trace.log
该怎么看这个错误?

$ obd --version
OceanBase Deploy: 3.1.1
REVISION: 94b5853a18ad1ad09d5afc30d9edb44643dd488c
BUILD_BRANCH: HEAD

1 个赞

提供一份yaml文件和obd日志 ~/.obd/cluster
提供observer.log

上传后缀不允许,都加了.txt
inner_config.yaml.txt (132 字节)
config.yaml.txt (1.3 KB)
observer.log.wf.txt (5.4 KB)
observer.log原始229M,传不上来,上传该文件出错,一直截到30M还是不行

observer.log需压缩一下发过来,先发一下obd的日志 ~/.obd/log下

image
image
没有找到obd日志
image

obd执行命令就会记录日志的。麻烦确认下执行用户是root还是fff用户执行的obd web部署。
日志上传失败再试试

fff

重试必失败

image

image
这个obd就是日志

obd.rar (51.2 KB)
observer.log删到只剩1万行,并且压缩,还是传不上来

observer.log.rar (41.1 KB)
3000行,终于传上来了

[2025-02-25 10:37:55.071] [831d872c-f321-11ef-89e5-2c9d1e2cbdd8] [WARNING] OBD-2000: (10.50.160.124) not enough memory. (Free: 125G, Need: 224G)
看着是你部署的时候 内存配置过大了 你配置小一点 试一下
[WARNING] OBD-1012: (10.50.160.124) clog and data use the same disk (/data1)
尽量clog盘和data盘 不要同盘 会影响性能

system_memory、memory_limit、log_disk_size取值计算方式:

  1. system_memory取值计算方式:– 16G<=memory_limit <=32G,system_memory=3-5G. – 32G<=memory_limit <=64G,system_memory=5-10G – memory_limit >64G,system_memory=取整数部分(3 *(memory_limit的平方根-3G))2. system_memory和sys租户没关系,sys租户是OB部署完成由系统自建的自适应资源租户,租户ID为1,而system_memory对应的租户ID为500。
  2. memory_limit没有上限边界,建议按实际内存free -m信息中的free列剩余大小进行规划设置。2. 支持动态增大和缩小,但不能比已分配出去的内存还小。3. memory_limit优先级大于memory_limit_percentage,即同时设置,以memory_limit生效。
  3. log_disk_size取值计算方式:log_disk_size>=memory_limit * 3 2. 预占用会提前申请磁盘空间,部署完成查看磁盘使用很大,属于正常现象。3. log_disk_size优先级大log_disk_percentage。


部署的时候我没有打开更多配置,也失败了

之前有自定义过参数,怎么着都不行,就来提问了

你别选用最大占用 先用最小可用部署一下 看看

应该是你环境的内存很大,但是你的内存都被使用或者缓存没释放,你释放下缓存手动设置下memory_mimt大小

应该是转到后台查看吧

观望一下处理过程

帮看看新报错

机器内存
$ free -g
total used free shared buff/cache available
Mem: 754 11 711 4 31 730
Swap: 3 0 3

/data1、/data2都有1.8T可用空间

白屏部署参数
cluster_id 86
obshell_port 2886
datafile_size 900
datafile_maxsize 900
datafile_next 自动分配
log_disk_size 900
max_syslog_file_count 1
memory_limit 250
system_memory 20
cpu_count 96
production_mode 自动分配

config.rar (671 字节)
inner_config.rar (159 字节)
obd.rar (35.4 KB)
observer.rar (73.3 KB)

日志我先看一下 麻烦提个新帖,方便跟踪问题。