1-1-1集群，开启弱读，其中一个副本cpu爆满，而其他机器cpu使用率才50%

OceanBase 技术问题

rocH 2026 年3 月 17 日 09:57 #1

【使用环境】生产环境 or 测试环境
【 OB or 其他组件】
【使用版本】
【问题描述】
集群为3副本集群，2.10是主副本。2.8和2.9是从副本。允许弱读。
如图，2.9副本机器cpu一直99%下不去

2.8和2.9都是从副本，但是只有2.9存在rpc吞吐量。2.8没有

observer.log cpu爆满开始的一个日志文件如下
observer.log.zip (31.7 MB)

topSql排查

巡检信息稍后补充

1 个赞

淇铭 2026 年3 月 17 日 10:03 #3

从top sql查看应该还是sql造成的看着cpu的占比不是很高 2.9节点上查看一下这个信息截图 top -H -p $(pgrep observer)

rocH 2026 年3 月 17 日 10:09 #4

辞霜 2026 年3 月 17 日 10:11 #5

SELECT zone, name, value FROM oceanbase.__all_zone WHERE name IN (‘region’, ‘idc’);
SHOW PROXYCONFIG LIKE ‘proxy_idc_name’;
查询下proxy和ob的机房配置。默认情况下弱读请求会优先路由到与 OBProxy 同 IDC / 同 Region 的 follower

牛马 2026 年3 月 17 日 10:15 #6

来学习

忙碌了两个小时的陈师傅 2026 年3 月 17 日 10:16 #7

分布式数据库集中式用法

rocH 2026 年3 月 17 日 10:18 #8

rocH 2026 年3 月 17 日 10:19 #9

没办法。旧项目，要分区的话，得等后面再规划了

僵小奕 2026 年3 月 17 日 10:20 #10

学习下

淇铭 2026 年3 月 17 日 10:31 #11

obstack这个命令不能直接调用需要进入到observer目录下 obstack ${pid of observer} > obstack.trc
使用obstack打一下堆栈信息

ocp上qps相关的截图也发一下吧

rocH 2026 年3 月 17 日 10:37 #12

obdiag check run 巡检信息
obdiag_check_report_observer_2026-03-17-09-33-15.log (124.8 KB)

淇铭 2026 年3 月 17 日 10:39 #13

还有一点以后的日志信息么？看日志信息像是租户的队列有积压

rocH 2026 年3 月 17 日 10:41 #14

obstack_792397.log (3.9 MB)

淇铭 2026 年3 月 17 日 10:46 #15

observer.log日志信息截图的时间以后的observer日志还有么？如果有打包发一下

rocH 2026 年3 月 17 日 10:50 #17

observer.zip (18.2 MB)
看这个日志，之前上传的日期不对

辞霜 2026 年3 月 17 日 10:59 #18

路由配置是设置的follower first么
ob_route_policy = ‘FOLLOWER_FIRST’;
堆栈中显示还是sql并行查询存在大量索引回表导致

rocH 2026 年3 月 17 日 11:02 #19

READONLY_ZONE_FIRST

配置了2个proxy。一个强读，给实时业务和事务使用。

一个弱读，给定时任务使用。

rocH 2026 年3 月 17 日 11:10 #20

qps监控信息

淇铭 2026 年3 月 17 日 11:13 #21

可能给你这几个top sql有关系看着执行的挺慢的看着语句还有重试你执行的语句中有用hint设置并发么？

辞霜 2026 年3 月 17 日 11:17 #22

UNMERGE_FOLLOWER_FIRST改成这个试试。上面是只读优先，follow副本不是只读副本

1 个赞