oceanbase4 扩容后资源均衡

hrsjw1 · 2025 年10 月 20 日 16:40

【使用环境】生产环境
【 OB or 其他组件】
【使用版本】

OceanBase 版本号 4.3.5.0

【问题描述】清晰明确描述问题
OCP 管理的 4.3.5 版本ob集群，由于资源紧张，新扩容两台服务器到集群，想均衡下现有资源，扩容后原节点 CPU/内存/硬盘并没有下降。请问如何操作能减轻原集群节点的性能压力？

【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接（右键跳转查看）：

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试，在发帖时输入 [@论坛小助手] 即可召唤小助手，欢迎试用！

论坛小助手 · 2025 年10 月 20 日 16:41

在 OCP 管理下的 OceanBase 4.3.5 集群扩容之后，为了进行资源均衡以减轻原节点的性能压力，可以通过调整租户资源池、重分布副本等方式来优化资源分配。虽然 obdiag 主要用于问题诊断，但在这种情况下，可以利用其日志采集功能来监控集群状态变化前后的情况，辅助判断资源调整的效果。

不过，针对您的需求，建议直接通过 OCP 的管理界面来进行资源均衡操作，因为 OCP 提供了更加直观和便捷的方式来管理和优化集群的资源使用情况。以下是一些建议的操作步骤：

如果您希望通过 obdiag 来收集一些调整前后的对比数据，例如 CPU 使用率、内存占用情况等，可以参考以下命令：

日志采集场景: 集群基础信息
日志采集命令: obdiag gather scene run --scene=observer.base

这个命令可以帮助您收集当前集群的基础信息，包括但不限于系统配置、网络状态、资源使用情况等。通过对比调整前后的这些信息，您可以更清晰地了解资源均衡操作的实际效果。

请问您是否需要进一步的帮助，或者有关于上述操作的具体疑问？如果有任何不确定的地方，请告知我，我将尽力为您提供详细的指导。

咖啡哥 · 2025 年10 月 20 日 16:48

先确认enable_rebalance是否为true。
另外看partition_balance_schedule_interval，默认是2h。可能还没触发，可以再等会看

辞霜 · 2025 年10 月 20 日 16:49

zone3 也需要扩容一下

hrsjw1 · 2025 年10 月 22 日 09:44

enable_rebalance是为true ， partition_balance_schedule_interval，默认是2h ，再看集群数据，还是扩容时候的样子，原节点内存、存储依然没有降下来

咖啡哥 · 2025 年10 月 22 日 09:55

你扩容，每个zone都应该扩。你的zone3只有1台机器
你有几个租户？
sys租户的enable_rebalance开了？

hrsjw1 · 2025 年10 月 22 日 14:49

现在只有两台服务器，等第三台到了就扩容上去

hrsjw1 · 2025 年10 月 22 日 14:50

现在只有两台服务器，等第三台到了就扩容上去。
集群用ocp 管理的 enable_rebalance 参数配置中显示的 true （应该是全局的），
一个sys租户，一个业务租户一共两个租户。