通过obd web 部署集群后,ocp express 部署失败

【 使用环境 】
测试环境

【 OB or 其他组件 】
OCP Express

【 使用版本 】
4.2.0

【问题描述】
1、参考 https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000000033135 中的方案二进行部署。运行完obd web 后,预检查也都成功通过,但是在部署报告中看到 ocp express部署失败

2、根据详情信息提示,最后查询报错内容如下

3、根据报错时间,查看obd日志,报错内容如下:

4、通过sys租户查看 ocp租户存在

期望:
1、如何获取obd部署时,metadb的用户以及密码,这样便于确认 meta db是否可用
2、如何修复 ocp express 无法启动

【附件】
obd.rar (45.8 KB)
新建文本文档.txt (15.4 KB)

提供一下 集群的配置 路径: ~/.obd/cluster/{deployname}/config.yaml

config.rar (936 字节)

直连ocp 的 meta db,提示 Server正在初始化

[root@OBDserver ~]# obclient -h xxxx -P 2881 -u meta@ocp -p xxxx
Enter password:
ERROR 8001 (08004): Server is initializing

并且查看集群资源时,没看到资源不够的情况
新建文本文档(1).txt (2.3 KB)

磁盘是机械盘还是固态盘。如果机械盘初始化比较慢。

ocpexpress 启动失败后 可以尝试 再次start集群 这时候已经running 的组件会跳过,只会再次拉起没有running 的组件。如果是ob 初始化慢导致的 可以用这个方案. 命令: obd cluster start xxxxxxx

防火墙是否关闭
ssh是否做了免密
试下这个方式:集群的部署名称
obd cluster start、restart xxx -s ip -c ocp-expresss

1、当前sys租户是可以访问的,我理解集群已经初始化结束了,如果集群没初始化好,按道理sys租户是不可能连的上的。ocp连接时提示 Server is initializing,我理解应该是 卡在了 ocp租户的创建上

还有一点就是昨天到现在,已经一夜了,机械盘再慢,这个初始化动作不应该慢到这个程度吧

现在再查下和这个状态 从你的截图里面看到 租户是creating的状态

2个方案:
1、 黑屏重新部署 : obd cluster redeploy {deployname}
2. 删除 这个ocp 租户 再创建 然后把meta用户根据 日志截图里面的密码创建出来 再执行 obd cluster start xxxxx

推荐先使用第一种 目前ob里面没数据 没风险 比较简单
第二种需要指定资源池 资源参数

正在创建中的租户也可以删除吗?因为刚才重启动作都被禁止了[ERROR] Deploy “HNYSOceanBase” is deployed. You could not restart an deployed cluster.

obd cluster redeploy {deployname} -f

目前是已经创建好了ob、obproxy、obagent,只有 ocp express是失败的,直接redeploy,已经安装的是会自动跳过去吗?

不会跳过,会全部清理重新部署。
因为创建租户是在安装ob阶段做的,所以现在的场景也需要从ob开始