OCP接管集群成功后,OCP和集群怎么停止和重启

【 使用环境 】测试环境
【 OB or 其他组件 】OCP
【 使用版本 】4.3.4-20250114101305.el7
【问题描述】OceanBase集群部署在192.168.10.151,192.168.10.152,OCP部署在192.168.10.153,OCP接管OceanBase集群后,集群和OCP主机应该怎么关机和重启,或者关机和重启指令是什么
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

根据文档库中的信息,以下是关于如何停止和重启 OCP 和 OceanBase 集群的详细步骤:

1. 停止和重启 OceanBase 集群

停止 OceanBase 集群

  • 登录 OCP。
  • 在左侧导航栏单击 集群 ,系统默认进入 集群列表 页签。
  • 集群列表 中选择待操作的集群并单击其集群名。
  • 在集群 概览 页面,单击右上角 图标,选择 停止集群
  • 在对话框中,选择是否在停止进程前执行转储操作(默认执行),并单击 停止
    注意:执行转储动作会延长停止进程的响应时间,但可以显著缩短 OBServer 恢复时间。
  • 停止集群任务提交后,您可通过弹出框中的 查看任务 ,查看停止进度。您也可在 任务中心 中查看该任务的停止进度。
  • 当该任务状态为 完成 ,且 集群 页的 集群列表 中,该集群的状态为 已停止 时,则集群停止成功。

重启 OceanBase 集群

  • 集群停止后,如需再次启用该 OceanBase 集群,可通过集群 概览 页右上角的 启动集群 ,再次启用该集群。

参考文档标题及段落标题:使用 OCP 进行运维 → OCP 迁出集群 → OCP 迁出 OceanBase 集群


2. 停止和重启 OCP 主机

OCP 是一个独立运行的服务,通常部署在单独的主机上。要停止或重启 OCP 主机,请按照以下步骤操作:

停止 OCP 服务

  • 登录到 OCP 所在的主机(例如 192.168.10.153)。
  • 使用以下命令停止 OCP 服务:
    sudo systemctl stop ocp-server
    
  • 如果需要完全关闭 OCP 主机,可以使用以下命令关机:
    sudo shutdown -h now
    

重启 OCP 服务

  • 登录到 OCP 所在的主机。
  • 使用以下命令重启 OCP 服务:
    sudo systemctl restart ocp-server
    
  • 如果需要重启整个 OCP 主机,可以使用以下命令:
    sudo reboot
    

注意事项

  1. OceanBase 集群停止的影响:停止 OceanBase 集群会导致业务中断,请确保在业务低峰期进行此操作。
  2. OCP 停止的影响:停止 OCP 服务不会影响 OceanBase 集群的运行,但会导致无法通过 OCP 管控集群。因此,建议仅在维护期间停止 OCP。
  3. 数据一致性:在停止 OceanBase 集群之前,建议执行转储操作以确保数据一致性。

如果您还有其他疑问,请随时联系 OceanBase 的技术支持团队获取进一步帮助。

更多信息请查看:

  1. 使用 OCP 进行运维
  2. 重启 OBServer 节点
  3. 停止集群
  4. 删除集群
  5. 停止 Zone
  6. 停止 OBServer 节点服务
  7. 迁出集群
  8. 使用备份恢复找回误删数据
  9. 注册 OCP 集群

使用ocp进行业务ob集群的启停工作。
ocp自己可以使用obd 进行操作
obd cluster list 查看ocp集群
使用obd cluster stop xxxxx即可

OceanBase集群主机断电重启后直接通过OCP界面集群 概览 页右上角的 启动集群即可?不需要执行 obd cluster start myoceanbase这条指令吗?OCP接管后这条指令还有效吗?

指令还有效但是接管后 建议使用ocp进行集群的操作。

无法停止集群,试了几次都


报错:OCP meta 集群 myoceanbase 不允许进行该操作

根据您的问题和提供的截图信息,以下是关于 OCP 管控 OceanBase 集群时的一些关键点解答:


1. OCP 界面启动集群是否足够?

是的,在 OCP 接管 OceanBase 集群后,您可以通过 OCP 界面直接启动集群。具体操作如下:

  • 登录 OCP。
  • 在左侧导航栏选择 集群,进入 集群列表
  • 找到目标集群(如 myoceanbase),点击其名称进入 概览 页面。
  • 在右上角点击 启动集群 按钮即可。

注意:

  • 如果集群主机断电重启后,OBServer 进程可能未自动启动。此时通过 OCP 的 启动集群 功能可以重新启动 OBServer 进程。
  • OCP 启动集群的操作本质上会调用底层工具(如 obd)来完成启动任务,因此无需手动执行 obd cluster start myoceanbase 命令。

2. obd cluster start myoceanbase 是否还有效?

在 OCP 接管 OceanBase 集群后,obd cluster start myoceanbase 命令仍然有效,但通常不建议直接使用该命令,原因如下:

  • OCP 是一个更高层次的管控平台,它已经接管了集群的生命周期管理功能,包括启动、停止等操作。
  • 如果直接使用 obd cluster start 或其他类似命令,可能会导致 OCP 和实际集群状态不一致,从而引发潜在问题。

总结:

  • 在 OCP 接管后,推荐通过 OCP 界面进行集群管理操作。
  • 如果确实需要使用 obd 命令,请确保了解其影响,并在必要时与 OCP 的状态同步。

3. 为什么无法停止集群?

根据您提供的截图信息,错误提示为:

OCP meta 集群 myoceanbase 不允许进行该操作

可能原因及解决方法:

  1. OCP Meta 集群限制:

    • myoceanbase 是 OCP 的 Meta 集群(即 OCP 自身依赖的 OceanBase 集群)。OCP 不允许停止 Meta 集群,因为这会导致 OCP 本身无法正常运行。
    • 解决方法: 如果您尝试停止的是 Meta 集群,请不要停止它。如果需要维护,请联系 OceanBase 技术支持团队获取进一步指导。
  2. 权限问题:

    • 当前登录用户可能没有足够的权限执行停止操作。
    • 解决方法: 确保以管理员身份登录 OCP,并检查用户权限配置。
  3. 集群状态异常:

    • 如果集群当前处于某种异常状态(如部分节点不可用),可能会阻止停止操作。
    • 解决方法: 检查集群状态,确保所有节点正常运行后再尝试停止操作。

4. 如何验证 OCP 和集群的状态一致性?

为了确保 OCP 和 OceanBase 集群的状态一致,您可以执行以下步骤:

  • 在 OCP 界面查看集群状态。
  • 使用以下命令直接连接到 OceanBase 集群,检查 OBServer 进程状态:
    ps -ef | grep observer
    
  • 如果发现状态不一致,可以通过 OCP 的 任务中心 查看最近的任务记录,确认是否有未完成的操作。

总结

  • 在 OCP 接管后,推荐通过 OCP 界面管理集群的启动和停止操作。
  • obd cluster start myoceanbase 命令仍然有效,但不建议直接使用。
  • 如果无法停止集群,请确认是否为 OCP Meta 集群,以及是否存在权限或状态异常问题。

如果您仍有疑问,建议联系 OceanBase 技术支持团队获取进一步帮助。

具体信息可参考以下文档:

  1. 副本管理
  2. 日志同步问题
  3. 查看合并过程
  4. OceanBase 数据库社区版 V4.0.0

(小助手的答复已结束,如未能解决您的问题,请继续提问并等待其他同学的回复,谢谢!)

你这个是ocp的meta集群。无法关闭的。关掉后 界面就无数据展示了
可以使用obd cluster stop myoceanbase

关机执行关闭OCP指令:obd cluster stop myocp,关闭OceanBase集群指令:obd cluster stop myoceanbase;开机执行开启OceanBase集群指令:obd cluster start myoceanbase,开启OCP指令:obd cluster start myocp?开机后能通过OCP管理页面开启OceanBase集群?

你的集群列表里面一共几个集群麻烦截图看一下

我是通过oceanbase-all-in-one-4.2.1_bp10_20250115.el7.x86_64.tar.gz
包安装的OCP,这个包里面包含了Ocean Base和OCP,先在192.168.10.151上安装了Ocean Base集群,集群安装成功后在192.168.10.153上安装OCP,安装OCP时选择的时已有OceanBase集群,应该选择全新的OceanBase集群吗?


你这里的myoceanbase就是你的ocp集群。
执行obd cluster start/stop myoceanbase 会同时关闭你的ocp服务和meta集群。
ocp管理启停的是后续使用ocp创建的业务集群

oceanbase集群和ocp不在同一台机器上,集群名称也不一样


obd cluster list看一下