白屏部署失败错误怎么查看v4.3.5

$ obd --version
OceanBase Deploy: 3.1.1
REVISION: 94b5853a18ad1ad09d5afc30d9edb44643dd488c
BUILD_BRANCH: HEAD

机器内存
$ free -g
total used free shared buff/cache available
Mem: 754 11 711 4 31 730
Swap: 3 0 3

/data1、/data2都有1.8T可用空间

白屏部署参数
cluster_id 86
obshell_port 2886
datafile_size 900
datafile_maxsize 900
datafile_next 自动分配
log_disk_size 900
max_syslog_file_count 1
memory_limit 250
system_memory 20
cpu_count 96
production_mode 自动分配

config.rar (671 字节)
inner_config.rar (159 字节)
obd.rar (35.4 KB)
observer.rar (73.3 KB)

看着像是obshell启动失败导致的。先看下obshell进程是否存在

ps ux,obshell存在的

bash /data1/fff/myob435/obproxy/obproxyd.sh /data1/fff/myob435/obproxy xxx 2883 daemon
/data1/fff/myob435/obproxy/bin/obproxy --listen_port 2883
-bash
sshd: fff@notty
/usr/libexec/openssh/sftp-server -l INFO -f AUTH
/usr/libexec/openssh/sftp-server -l INFO -f AUTH
sleep 1
ps ux
-bash
/data1/fff/myob435/oceanbase/bin/observer -r xxx:2882:2881 -p 2881 -P 2882 -z zone1 -n myob435 -c 8
/data1/fff/myob435/oceanbase/bin/obshell daemon --ip xxx --port 2886
/data1/fff/myob435/oceanbase/bin/obshell server --ip xxx --port 2886

我看的您的资源 那么大。 您在检查下 您的其他部署的是否成功了。 发个截图看看。

  1. 如果其他组件 都成功了 , 尝试 obd cluster start cluster_name 试一下, 可能就成功了。

之前obd web提示agent部署成功了,刚试了一下 obd cluster start ,没有报错,status 变成 running 了

1 个赞

我看集群状态已经正常了,是否可以把 obshell 的日志发一下,我们看一下为什么会有这个报错。


obshell 相关的日志位于 /data1/fff/myob435/oceanbase/log_obshell 下。

obshell.rar (41.9 KB)

以前我为了解决这个问题 ,处理了好几遍。 都是obshell的问题。 最后重启好了。 good!

1 个赞

好吧,这个还算简单,我还遇到过部署全部失败的,3节点,即使最小占用也不行,现在环境没了,稍后复现一下,提个新问答,到时候再帮忙看看

1 个赞

新提问:三节点白屏部署失败求助,最小可用也不行v4.3.5