使用vmware拉取三台centos系统的虚拟机,部署OceanBase集群环境失败

【 使用环境 】
vmware:vmware Workstation 17 Pro for Windows
虚拟机版本:阿里云下载CentOS-7-x86_64-DVD-2009.iso
网络模式:桥接模式
【 OB or 其他组件 】
OceanBase社区版一键安装包 (OceanBase All in One)
【 使用版本 】
V4.2.0
【问题描述】

  1. 使用vmware Workstation 17 Pro for Windows安装三台centos7 虚拟机,虚拟机网络模式设置为桥接模式,系统自动分配的局域网IP地址分别为192.168.1.6,192.168.1.7,192.168.1.8

  2. 按照V4.2.0文档关闭每个节点的防火墙。
    https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000000035600
    systemctl disable firewalld
    systemctl stop firewalld
    systemctl status firewalld

  3. 修改ulimits 配置
    每个节点执行:echo -e “* soft nofile 20000\n* hard nofile 20000” >> /etc/security/limits.d/nofile.conf

  4. 主节点192.168.1.6安装jdk1.8
    sudo yum install java-1.8.0-openjdk

  5. 按照V4.2.0的快速上手体验ob数据库文档操作- 部署 OceanBase 集群环境, 使用白屏部署 OceanBase 数据库

全程使用ROOT用户操作,无其它用户

配置入如上图,预检查完全通过后,点击部署,部署失败。

【复现路径】按照上述路径必现
【问题现象及影响】
部署失败
【问题分析】
通过查看日志,日志中大量出现 ping -W 1 -c 1 -I ens32 192.168.1.6的场景失败,做IP互通测试,发现此指令ping其它节点如在192.168.1.6上使用ping -W 1 -c 1 -I ens32 192.168.1.7无任何问题,但是使用ens32 ping自身节点IP都不会成功,不确定这是否会影响部署。后续日志同时出现了大量目录或文件不存在的错误,但其实目录或文件实际都存在。

【附件】
obd.2023-09-06.txt (730.1 KB)

麻烦调整一下磁盘再试试,看起来有个磁盘不足的问题[ERROR] OBD-2003: (192.168.1.6) / not enough disk space. (Avail: 45.9G, Need: 46.0G)

确实应该是磁盘的问题,扩展磁盘后ob安装成功,但是ocp-express还是安装失败了。32G
电脑内存使用情况已经使用到了29G(拉虚拟机时给每台虚拟机都分配的4U10G),每台Ob的配置参数system_memory=2G,memory_limit=7G 。不知道是不是内存不足导致的。日志没看到相关报错。
ocp-express.log (3.5 KB)
obd.txt (910 KB)
bootstrap.log (5.4 KB)

看起来还有文件数的问题,麻烦调一下ulimits配置,调整到65535吧

文件数的问题是跑检查的时候不是部署的时候爆出来的,修改配置后跑检查项通过了

看日志应该是性能比较差,没有在OBD的等待时间内完成启动。执行下obd cluster start xxx试下

单独调用ocp-express-server.jar能看到内存不足的报错,但是这部分报错好像没打印出来。
因此我给主节点加了2G内存,现在安装成功了。