hrsjw1
#1
【 使用环境 】生产环境
【 OB or 其他组件 】
【 使用版本 】
OceanBase 版本号 4.3.5.0
【问题描述】清晰明确描述问题
OCP 管理的 4.3.5 版本ob集群,由于资源紧张,新扩容两台服务器到集群,想均衡下现有资源,扩容后原节点 CPU/内存/硬盘 并没有下降 。 请问 如何操作能减轻 原集群节点的性能压力 ?
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):
【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)
【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!
论坛小助手
#3
在 OCP 管理下的 OceanBase 4.3.5 集群扩容之后,为了进行资源均衡以减轻原节点的性能压力,可以通过调整租户资源池、重分布副本等方式来优化资源分配。虽然 obdiag 主要用于问题诊断,但在这种情况下,可以利用其日志采集功能来监控集群状态变化前后的情况,辅助判断资源调整的效果。
不过,针对您的需求,建议直接通过 OCP 的管理界面来进行资源均衡操作,因为 OCP 提供了更加直观和便捷的方式来管理和优化集群的资源使用情况。以下是一些建议的操作步骤:
-
检查当前资源使用情况:在 OCP 中查看各个节点的资源使用率,包括 CPU、内存、磁盘空间等指标,识别出负载较高的节点。
-
调整租户资源配置:如果发现某些租户的资源使用不合理,可以适当调整这些租户的资源配置,如增加或减少 CPU 核数、内存大小等。
-
重新分布副本:对于负载过高的节点,可以考虑手动或自动触发副本重分布,使副本均匀分布在不同的节点上,从而达到负载均衡的目的。
-
监控调整效果:调整后,继续通过 OCP 监控集群的资源使用情况,确保调整达到了预期的效果,同时注意观察业务性能的变化,确保没有引入新的问题。
如果您希望通过 obdiag 来收集一些调整前后的对比数据,例如 CPU 使用率、内存占用情况等,可以参考以下命令:
日志采集场景: 集群基础信息
日志采集命令: obdiag gather scene run --scene=observer.base
这个命令可以帮助您收集当前集群的基础信息,包括但不限于系统配置、网络状态、资源使用情况等。通过对比调整前后的这些信息,您可以更清晰地了解资源均衡操作的实际效果。
请问您是否需要进一步的帮助,或者有关于上述操作的具体疑问?如果有任何不确定的地方,请告知我,我将尽力为您提供详细的指导。
附上敏捷诊断工具 obdiag 使用帮助链接
咖啡哥
#4
先确认enable_rebalance是否为true。
另外看partition_balance_schedule_interval,默认是2h。可能还没触发,可以再等会看
hrsjw1
#6
enable_rebalance是为true , partition_balance_schedule_interval,默认是2h , 再看集群数据,还是扩容时候的样子,原节点内存、存储依然没有降下来
咖啡哥
#7
你扩容,每个zone都应该扩。你的zone3只有1台机器
你有几个租户?
sys租户的enable_rebalance开了?
hrsjw1
#9
现在只有两台服务器 ,等第三台到了 就扩容上去 。
集群用ocp 管理的 enable_rebalance 参数配置中显示的 true (应该是全局的),
一个sys租户,一个业务租户 一共两个租户。