【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】准生产
【 使用版本 】4.3.3-20241219140415
【问题描述】
初始创建ocp时创建了1-1-1的meta集群,之后再该集群上创建了业务租户,当时对ocp理解有误,现在意识到了问题,想寻求解决方案。
我自己想了以下方案,想询问是否可行或者又更好的:
- 创建一个新的ocp来接管改ocp集群(不确定可行性)
- 通过全量备份来在一个单节点集群上恢复所有数据库 然后重建1-1-1的集群 在切换回来
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):
【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)
【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!
@论坛小助手
1 个赞
论坛小助手
#4
您的设想方案有一定的可行性,但也有潜在的风险。首先,创建一个新的 OCP 来接管现有 OCP 集群的方法可能会遇到兼容性和数据同步的问题。其次,通过全量备份在单节点集群上恢复所有数据库,然后再重建 1-1-1 的集群,虽然理论上可行,但实际操作过程中可能会面临数据一致性和集群稳定性的问题。以下是具体的建议和步骤:
-
创建新的 OCP 集群接管现有集群:
- 创建一个新的 OCP 集群。
- 将现有的 meta 集群信息迁移到新的 OCP 集群中。
- 确认新 OCP 集群能够正常接管和管理现有集群。
-
通过全量备份恢复数据:
- 在单节点集群上进行全量备份。
- 恢复所有数据库到单节点集群。
- 重新创建 1-1-1 的集群。
- 将数据从单节点集群迁移到新的 1-1-1 集群。
-
注意事项:
- 在进行上述操作之前,确保备份所有重要数据。
- 测试环境中先进行模拟操作,确保方案的可行性和稳定性。
- 在生产环境中操作时,建议在低峰时段进行,以减少对业务的影响。
此外,您可以参考官方文档中的相关章节,了解更详细的步骤和注意事项。具体操作可参见官网《OceanBase 云平台》文档 OCP 接管集群 和 OCP 升级集群。
检索到的文档如下:
- 使用 OCP 进行运维
2 个赞
咖啡哥
#6
创建一个新的业务集群,把你原来 meta 集群里面的租户备份恢复过去,或者用 oms 同步过去。
1 个赞
机器资源不够了 而且数据量比较大 周末两天可能迁移不完。所以暂时用来另一个ocp来接管原来的meta集群 目前看是没有什么问题。大佬可以指导下以后会有啥问题吗
咖啡哥
#15
没理解你现在的架构是咋样的?
看你之前的描述是说metadb集群里面放了业务租户。这个是不推荐放一起的。当ocp接管的集群多了或者说某个业务租户的sql很多。ocp_monitor租户资源消耗也很大。
辞霜
#17
建议使用oms 全量+增量方式把业务租户切换到其他集群上
原来的情况是我搭建了一个ocp的单节点,后面扩展成立1-1-1的分布式集群,当时没搞懂meta,和业务集群的概念,就把很多业务租户放到这个1-1-1的集群里面了。现在的情况是我又搭建了一个ocp的单节点,然后把上述集群迁出,用这个ocp单节点进行运维。因为机器资源不足,短时间没办法在弄个新的业务集群了。