ocp-express 启动报错

v4.2.0 arm
问题: 部署成功未报错,obd start cluster 时 ocp-express报错
Start ocp-express
Start ocp-express ok
[ERROR] failed to start server1(10.125.144.18) ocp-express
[ERROR] ocp-express start failed
Wait for observer init ok
日志:
ocp-express.log (885.9 KB)

存在的问题:
1、 ocp deploy时缺少校验,比如指定的网卡不对start时才报错
2、 输出信息有误导。比如上面 start ocp 是成功的,接下来check 时报错 报start failed。
3、 ocp启动较慢,如何再启动时不启动ocp 或者是报错后 如何单独启动

问题1:部署阶段主要是下载和包安装过程,存在一些依赖,因此集中在start过程进行校验的。
问题2:这块可能有问题,可以提供下安装时的配置文件,当前提供的日志需要结合配置文件确认一些问题;
问题3:单独重启组件方式 obd cluster restart -c ocp-express

ocp_meta_tenant:
tenant_name: ocpdb
max_cpu: 2
memory_size: 2G
log_disk_size: 7680M

。。。。。。
ocp-express:
depends:

  • oceanbase-ce
  • obproxy-ce
  • obagent
    servers:
  • name: server1
    ip: 10.xxxxxx
    global:
    home_path: /data/oceanbase/ocp-server
    memory_size: 1G
    admin_passwd: xxxx
    logging_file_total_size_cap: 100GB

麻烦提供下obd日志 ~/.obd/log/obd

obd.rar (192.0 KB)

现在obd看集群状态是stop的
image

数据库内只能看到2个server

第3台server的进程是正常的

obd的状态非实时同步的,我看日志 [2023-08-29 14:25:55.340] [e8d08916-4634-11ee-a6c4-fe1c6139190b] [INFO] Deploy “ob420” is stopped 已经是停止状态了。
这个OB是你后台手动起的吗 ? ps -ef|grep obs

都是自己起的 没手动起过

ps -ef|grep obs 看下启动时间
再obd重启下环境
obd cluster restart 部署名称
看下什么情况

我destroy后重新部署了一次,现在看能看到第3个节点了 但是ocp-express还是原来的样子报错 起不来

私聊解决

看express报错解析格式有问题
org.springframework.beans.factory.BeanCreationException: Error creating bean with name ‘ocpExpressInitializer’: Invocation of init method failed; nested exception is java.lang.RuntimeException: Init by spring config files failed, please check config file format

obd配置debug信息解析节点IP是空值

需要提供下你完整的obd部署配置文件(非粘贴),确认下配置格式是否正确。

ob420.rar (766 字节)

obd 黑屏部署和obd web 白屏部署方式,生成的配置文件在ocp-express模块的 yaml缩进格式表现不一致导致。
可以先使用obd web方式部署,这个问题内部调整下、

OB和OBagent的server的name 也需要保持一致。