OCP所在的机器重启了,如何恢复OCP的所有服务?

【 使用环境 】生产环境
【 OB or 其他组件 】OCP
【 使用版本 】4.2.1
【问题描述】OCP所在机器重启了,OCP服务、OCP底层依赖的单节点的observer和obproxy都不存在了,如何快速恢复OCP服务?
【复现路径】直接重启物理机
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

obd cluster start ocp_cluster
可以这样,ocp_cluster替换为你部署的集群名

如果都使用 obd web进行部署

  1. 中控机上执行obd cluster list
  2. 然后obd cluster start ob_clustername
  3. 再执行obd cluster start ocp_clustername
    4.执行obd cluster display ob_clustername|ocp_clustername

##########################
如果observer是单点并且是 软件 自己手工部署的比如rpm包。

  1. 手工执行以前的创建命令
  2. 然后在启动ocp 按照上面的步骤
1 个赞

执行了如下命令:
cd ocp-all-in-one/bin && bash install.sh
source ~/.oceanbase-all-in-one/bin/env.sh


但是obd cluster list没有输出

部署是用root还是admin呢,到admin用户下面obd cluster list试试呢?

root用户搭建的,底层依赖的meta db也是通过web新建出来的,不知道是不是这个原因,底层的obd cluster无法找到meta db的配置

你ocp是怎么部署的?

ocp是使用install安装的并非是使用obd?
ocp安装时候确认下是否是使用的新建meta集群模式?
请问是否是使用了两个obd进行部署了?
您所说的web是ocp的web还是obd的web?

ocp-installer

ocp是使用install安装的,ocp安装时候的时候是新建meta集群模式的。

我的理解是先启动底层的meta db,然后重启上层的ocp服务,应该就好了。但是现在是不知道底层的meta db该如何启动?

执行下红框内的命令发下结果



这种通过界面新建meta db的方式,底层是通过什么方式新建的db?obd cluster list显示为空

解决了,通过ocp-installer安装的时候直接在界面上选择新建meta db的情况,底层不是通过obd部署的单节点的oceanbase数据库,而是直接通过ocp-installer部署的,直接通过ocp-installer重新启动底层meta db再启动ocp服务即可,具体如下:
启动meta db:


启动ocp:

以上,ocp服务就已经恢复了。
物理机重启后,显示服务一直是running,其实没有running,其次安装的时候不是一次安装成功,误以为ocpmetadb是之前失败的安装,其实是底层的meta db(ps:保留安装日志和相关信息很重要)。
希望对大家有所帮助,谢谢~

补充信息如下:
OCP版本号: 4.2.0-20230921
OCP-Server、MetaDB部署在同一台机器上