obd白屏安装oceanbase和express失败

【 使用环境 】生产环境
【 OB or 其他组件 】
【 使用版本 】4.2.4
【问题描述】一键安装后,使用obd白屏部署,最后显示oceanbase和ocpexpress部署失败,现在手动执行命令停止、启动也报错

【复现路径】按照白屏部署步骤部署,预检测没有问题
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见

1 个赞

image
先将obd web进程停掉。然后发一份白屏化部署obd详细日志,这边帮忙分析下

1 个赞

您好 OBD白屏部署的详细日志是在哪里查看提取啊

1 个赞

安装完会提示执行 obd display xxxxxxxxxx如果找不到,可以直接发一份完整obd日志
在~/.obd/log

1 个赞

obd.txt (1.0 MB)


这是obd的日志 现在手动启动就卡在这 ,observer端口都在,集群状态显示deployed

1 个赞

搭建的架构是啥样的,应该是ssh互信问题。obd原理是要ssh到目标机器执行命令的
存在报错root@10.183.29.199 connect failed:

199是主节点 部署server ocpexpress obproxy 剩余两个节点部署server 三台组成一个集群,三台设备是在一个网内 不存在网络互通问题,199节点ssh端口不是默认的22 是自定义端口,测试了ssh root@IP 是正常可以的,补充了下刚ocp启动失败的日志

ocp.txt (46.4 KB)

在199节点 ssh到202看看能过去么
你在202节点使用执行下面命令试一下
/data/boce/oceanbase/bin/obshell admin start --ip 10.183.29.202 --port 2886

可以正常ssh 命令也能正常启动 ,我发现我现在系统是基于centos7的 我用的是el8的安装包 ,和这个会有关系么

这个没什么影响,你使用obshell把三个节点都启动,然后使用obd restart试试看还是会报ssh错误么

不好意思 刚看错服务器了 199、200都能正常启动,202的obshell启动不了,我看是报了一个这个错误

您好 老师我这边处理完了 多谢一直解答(把原来的集群删除了 从新部署可以了)

好的