【 使用环境 】测试环境
【 OB or 其他组件 】OCP
【 使用版本 】4.3.4-20250114101305.el7
【问题描述】OceanBase集群部署在192.168.10.151,192.168.10.152,OCP部署在192.168.10.153,OCP接管OceanBase集群后,集群和OCP主机应该怎么关机和重启,或者关机和重启指令是什么
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):
【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)
【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!
论坛小助手
#3
根据文档库中的信息,以下是关于如何停止和重启 OCP 和 OceanBase 集群的详细步骤:
1. 停止和重启 OceanBase 集群
停止 OceanBase 集群
- 登录 OCP。
- 在左侧导航栏单击 集群 ,系统默认进入 集群列表 页签。
- 在 集群列表 中选择待操作的集群并单击其集群名。
- 在集群 概览 页面,单击右上角 … 图标,选择 停止集群。
- 在对话框中,选择是否在停止进程前执行转储操作(默认执行),并单击 停止。
注意:执行转储动作会延长停止进程的响应时间,但可以显著缩短 OBServer 恢复时间。
- 停止集群任务提交后,您可通过弹出框中的 查看任务 ,查看停止进度。您也可在 任务中心 中查看该任务的停止进度。
- 当该任务状态为 完成 ,且 集群 页的 集群列表 中,该集群的状态为 已停止 时,则集群停止成功。
重启 OceanBase 集群
- 集群停止后,如需再次启用该 OceanBase 集群,可通过集群 概览 页右上角的 启动集群 ,再次启用该集群。
参考文档标题及段落标题:使用 OCP 进行运维 → OCP 迁出集群 → OCP 迁出 OceanBase 集群
2. 停止和重启 OCP 主机
OCP 是一个独立运行的服务,通常部署在单独的主机上。要停止或重启 OCP 主机,请按照以下步骤操作:
停止 OCP 服务
重启 OCP 服务
注意事项
-
OceanBase 集群停止的影响:停止 OceanBase 集群会导致业务中断,请确保在业务低峰期进行此操作。
-
OCP 停止的影响:停止 OCP 服务不会影响 OceanBase 集群的运行,但会导致无法通过 OCP 管控集群。因此,建议仅在维护期间停止 OCP。
-
数据一致性:在停止 OceanBase 集群之前,建议执行转储操作以确保数据一致性。
如果您还有其他疑问,请随时联系 OceanBase 的技术支持团队获取进一步帮助。
更多信息请查看:
- 使用 OCP 进行运维
- 重启 OBServer 节点
- 停止集群
- 删除集群
- 停止 Zone
- 停止 OBServer 节点服务
- 迁出集群
- 使用备份恢复找回误删数据
- 注册 OCP 集群
辞霜
#4
使用ocp进行业务ob集群的启停工作。
ocp自己可以使用obd 进行操作
obd cluster list 查看ocp集群
使用obd cluster stop xxxxx即可
OceanBase集群主机断电重启后直接通过OCP界面集群 概览 页右上角的 启动集群即可?不需要执行 obd cluster start myoceanbase这条指令吗?OCP接管后这条指令还有效吗?
辞霜
#6
指令还有效但是接管后 建议使用ocp进行集群的操作。
无法停止集群,试了几次都
报错:OCP meta 集群 myoceanbase 不允许进行该操作
论坛小助手
#8
根据您的问题和提供的截图信息,以下是关于 OCP 管控 OceanBase 集群时的一些关键点解答:
1. OCP 界面启动集群是否足够?
是的,在 OCP 接管 OceanBase 集群后,您可以通过 OCP 界面直接启动集群。具体操作如下:
- 登录 OCP。
- 在左侧导航栏选择 集群,进入 集群列表。
- 找到目标集群(如
myoceanbase
),点击其名称进入 概览 页面。
- 在右上角点击 启动集群 按钮即可。
注意:
- 如果集群主机断电重启后,OBServer 进程可能未自动启动。此时通过 OCP 的 启动集群 功能可以重新启动 OBServer 进程。
- OCP 启动集群的操作本质上会调用底层工具(如 obd)来完成启动任务,因此无需手动执行
obd cluster start myoceanbase
命令。
2. obd cluster start myoceanbase
是否还有效?
在 OCP 接管 OceanBase 集群后,obd cluster start myoceanbase
命令仍然有效,但通常不建议直接使用该命令,原因如下:
- OCP 是一个更高层次的管控平台,它已经接管了集群的生命周期管理功能,包括启动、停止等操作。
- 如果直接使用
obd cluster start
或其他类似命令,可能会导致 OCP 和实际集群状态不一致,从而引发潜在问题。
总结:
- 在 OCP 接管后,推荐通过 OCP 界面进行集群管理操作。
- 如果确实需要使用
obd
命令,请确保了解其影响,并在必要时与 OCP 的状态同步。
3. 为什么无法停止集群?
根据您提供的截图信息,错误提示为:
OCP meta 集群 myoceanbase 不允许进行该操作
可能原因及解决方法:
-
OCP Meta 集群限制:
-
myoceanbase
是 OCP 的 Meta 集群(即 OCP 自身依赖的 OceanBase 集群)。OCP 不允许停止 Meta 集群,因为这会导致 OCP 本身无法正常运行。
-
解决方法: 如果您尝试停止的是 Meta 集群,请不要停止它。如果需要维护,请联系 OceanBase 技术支持团队获取进一步指导。
-
权限问题:
- 当前登录用户可能没有足够的权限执行停止操作。
-
解决方法: 确保以管理员身份登录 OCP,并检查用户权限配置。
-
集群状态异常:
- 如果集群当前处于某种异常状态(如部分节点不可用),可能会阻止停止操作。
-
解决方法: 检查集群状态,确保所有节点正常运行后再尝试停止操作。
4. 如何验证 OCP 和集群的状态一致性?
为了确保 OCP 和 OceanBase 集群的状态一致,您可以执行以下步骤:
- 在 OCP 界面查看集群状态。
- 使用以下命令直接连接到 OceanBase 集群,检查 OBServer 进程状态:
ps -ef | grep observer
- 如果发现状态不一致,可以通过 OCP 的 任务中心 查看最近的任务记录,确认是否有未完成的操作。
总结
- 在 OCP 接管后,推荐通过 OCP 界面管理集群的启动和停止操作。
-
obd cluster start myoceanbase
命令仍然有效,但不建议直接使用。
- 如果无法停止集群,请确认是否为 OCP Meta 集群,以及是否存在权限或状态异常问题。
如果您仍有疑问,建议联系 OceanBase 技术支持团队获取进一步帮助。
具体信息可参考以下文档:
- 副本管理
- 日志同步问题
- 查看合并过程
- OceanBase 数据库社区版 V4.0.0
(小助手的答复已结束,如未能解决您的问题,请继续提问并等待其他同学的回复,谢谢!)
辞霜
#9
你这个是ocp的meta集群。无法关闭的。关掉后 界面就无数据展示了
可以使用obd cluster stop myoceanbase
关机执行关闭OCP指令:obd cluster stop myocp,关闭OceanBase集群指令:obd cluster stop myoceanbase;开机执行开启OceanBase集群指令:obd cluster start myoceanbase,开启OCP指令:obd cluster start myocp?开机后能通过OCP管理页面开启OceanBase集群?
我是通过oceanbase-all-in-one-4.2.1_bp10_20250115.el7.x86_64.tar.gz
包安装的OCP,这个包里面包含了Ocean Base和OCP,先在192.168.10.151上安装了Ocean Base集群,集群安装成功后在192.168.10.153上安装OCP,安装OCP时选择的时已有OceanBase集群,应该选择全新的OceanBase集群吗?
辞霜
#13
你这里的myoceanbase就是你的ocp集群。
执行obd cluster start/stop myoceanbase 会同时关闭你的ocp服务和meta集群。
ocp管理启停的是后续使用ocp创建的业务集群
oceanbase集群和ocp不在同一台机器上,集群名称也不一样