【 使用环境 】生产环境
【 OB or 其他组件 】OCP4.3.1 metadb4.1
【 使用版本 】社区版
【问题描述】目前社区版 OCP 所接管的集群规模特别大,导致OCP的metadb集群负载特别高,目前已经达到性能瓶颈,影响OCP的使用。OCP与metadb集群部署在同一个主机上,主机属于物理机,无法扩容。 可以将metadb规模扩容到3节点吗?(目前为单节点) ,减少metadb的负载
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):
【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)
【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手 ] 即可召唤小助手,欢迎试用!
5 个赞
清愁
2025 年9 月 2 日 14:35
#3
可以的吧,扩成1-1-1后,把primary zone调整为’z1,z2,z3’,理论上可以将负载分散
2 个赞
旭辉
2025 年9 月 2 日 17:20
#5
采用集群扩容zone,然后租户扩副本,设置primary zone 优先级相同的方式,可以打散分区leader的分布,在一定程度上缓解单节点的压力,
也可以将primary zone设置为其它两个zone,缓解zone1的压力,
也可以不使用集群扩zone方式,可以直接增加observer的方式 给zone1增加1个节点或者2个节点,然后租户unit number调整为2或者3,再调小resource unit的CPU和内存,这样可以zone内负载均衡,另外多出来的CPU和内存也可以给到ocp-server。
另外2个问题就是OCP的版本太低 建议升级,以及OBServer单副本的单点问题需要关注。
4 个赞
撑伞接落花
2025 年9 月 3 日 09:20
#8
可以拆分ocp吗?
比如 ocp-server 跟 metadb 在一台机器,我把 metadb给拆分出去,这个方案可行吗?
3 个赞
旭辉
2025 年9 月 3 日 09:48
#10
可以先扩容,再缩容,将和OCP Server在同一台机器上的OBserver缩容掉
2 个赞
老师,我们用OCP白屏可以操作metaDB扩容吗,还是只能用OBD黑屏命令扩容
2 个赞
旭辉
2025 年9 月 3 日 11:21
#14
不能,只能扩容为1-1-1,再缩容掉其中一个节点,缩容操作OBD目前不支持,只能黑屏操作
2 个赞
撑伞接落花
2025 年9 月 3 日 11:41
#15
在ocp 对元数据集群扩容 不能执行,只能黑屏obd 操作。
obd cluster scale_out ocpcluster -c add_observer.yaml
这个 add_observer.yaml 配置文件能不能给一个参考的,单zone 两节点。
2 个赞
撑伞接落花
2025 年9 月 3 日 15:06
#17
oceanbase-ce:
servers:
- name: server2
ip: 10.38.36.xxx
server2:
mysql_port: 2881 # External port for OceanBase Database. The default value is 2881.
rpc_port: 2882 # Internal port for OceanBase Database. The default value is 2882.
home_path: /home/admin/observer
zone: zone1
2 个赞
旭辉
2025 年9 月 3 日 15:16
#18
支持的,配置下中控机到新增server的ssh免密
2 个赞
旭辉
2025 年9 月 3 日 15:29
#19
OCP通过关闭黑名单操作,OCP也可以对自身的metadb进行扩缩容,只是后续要手动去同步OBD的yaml文件,属于非标操作,一般不建议
update config_properties set value='' where `key`='ocp.ob.cluster.ops.blacklist';
3 个赞
撑伞接落花
2025 年9 月 4 日 10:23
#20
通过黑屏去 把odp 跟ob集群做关联,这个有命令吗?麻烦提供一下,找了一圈 没找大,谢谢!
旭辉
2025 年9 月 4 日 10:49
#21
没有所谓关联命令,黑屏部署的ODP是在启动时通过启动命令关联OB集群,有两种启动方式rslist和configurl方式,参考
https://www.oceanbase.com/docs/common-odp-doc-cn-1000000003575306
如果是白屏部署的ODP,这里禁止关联主要是因为OCP metadb的黑名单操作,被禁止了,可以按照前面的说的暂时关闭白名单,就可以进行关联了
我们在测试环境测试,部署OCP4.2.0(这个版本配套的metadb是4.1版本),在OCP-SERVER启动的健康检查环节,出现 METADB 与 SERVER 时间相差八小时,OCP-SERVER 与 METADB都是在同一台主机
我们目前检查下 主机时区 与 DB时区 都是正常的,这个版本的OCP是不是检查逻辑有问题啊