oceanbase压测性能性能提升

MJ2012 · 2023 年2 月 15 日 14:37

【使用环境】生产环境
【 OB 】 OceanBase
【使用版本】3.1.4
【问题描述】3台裸金属主机（160core700GB内存20T磁盘）组的集群，压测结果不是很理想，并发终端超过140个就开始报错了，还有优化空间么？
租户配置：

benchmark压测结果

张雨齐 · 2023 年2 月 15 日 14:48

按照官方的优化措施进行调整了吗？

以下是官方的优化措施，具体配置等，可以参考

在 OceanBase 上进行 TPC-C 测试

MJ2012 · 2023 年2 月 15 日 15:02

安装oceanbases时已经调整过系统参数，压测之前已按要求给表加了索引，合并。

君野 · 2023 年2 月 15 日 15:18

https://www.oceanbase.com/docs/community-observer-cn-10000000000450312 这个文档更加详细一点，包括了对ob系统内部参数的调优。另外“并发终端超过140个就开始报错了”这个看着不太符合预期，可以贴下报错的日志信息看看

MJ2012 · 2023 年2 月 15 日 15:50

这个是150个并发终端时报的错，每分钟平均事务超过11万，就报错了

君野 · 2023 年2 月 15 日 16:13

看着是断连了，可以看下压测期间，客户端和服务端的进程是否还在，dmesg -T看下是不是因为memory_limit配的太大，oom了。另外可以排查下obproxy和observer的日志，看报错期间，有没有什么日志信息

MJ2012 · 2023 年2 月 16 日 10:48

您好，初始化数据时，我看有异常告警

这个应该更改那个参数呢？

set global ob_plan_cache_percentage=20

这个对么？

君野 · 2023 年2 月 16 日 11:25

你贴的这个告警，可以适当调大点ob_plan_cache_percentage。参考：https://www.oceanbase.com/docs/community-observer-cn-10000000000901638

不过这个跟并发终端超过140个就开始报错了，好像关系不是很大。我看贴的截图，断连的时候应该已经导数完了，是在run的时候报的，不是在初始化数据的时候报的，可以粘下报错对应时间点的proxy和observer的日志

MJ2012 · 2023 年2 月 17 日 14:24

按照教程完成了压测，3节点主机压测结果
Overall tpmC: 242158.80
Overall tpmTotal: 538075.80

并发客户端超过1000，吞吐量就上不去了，但是cpu 不到20%
并且教程里的优化点应该实在极端情况下做的吧，压测的时候 ocp平台是采集不到数据的。
那么在生产环境下，应该关注那些性能优化点呢？

张雨齐 · 2023 年2 月 17 日 14:50

感觉好少的tpmc.

我用3zone，6台测试有50万的tpmc

皇甫侯 · 2023 年2 月 17 日 22:54

看看是不是压力机的问题。。我估计OB的压力都没起来