oceanbase压测性能性能提升

【 使用环境 】生产环境
【 OB 】 OceanBase
【 使用版本 】3.1.4
【问题描述】3台裸金属主机(160core700GB内存20T磁盘)组的集群,压测结果不是很理想,并发终端超过140个就开始报错了,还有优化空间么?
租户配置:


benchmark压测结果

按照官方的优化措施进行调整了吗?

以下是官方的优化措施,具体配置等,可以参考

在 OceanBase 上进行 TPC-C 测试

https://www.oceanbase.com/docs/community-observer-cn-0000000000745129

安装oceanbases时已经调整过系统参数,压测之前已按要求给表加了索引,合并。

https://www.oceanbase.com/docs/community-observer-cn-10000000000450312 这个文档更加详细一点,包括了对ob系统内部参数的调优。另外“并发终端超过140个就开始报错了”这个看着不太符合预期,可以贴下报错的日志信息看看


这个是150个并发终端时报的错,每分钟平均事务超过11万,就报错了

看着是断连了,可以看下压测期间,客户端和服务端的进程是否还在,dmesg -T看下是不是因为memory_limit配的太大,oom了。另外可以排查下obproxy和observer的日志,看报错期间,有没有什么日志信息

您好,初始化数据时,我看有异常告警



这个应该更改那个参数呢?

set global ob_plan_cache_percentage=20  

这个对么?

你贴的这个告警,可以适当调大点ob_plan_cache_percentage。参考:https://www.oceanbase.com/docs/community-observer-cn-10000000000901638

不过这个跟并发终端超过140个就开始报错了,好像关系不是很大。我看贴的截图,断连的时候应该已经导数完了,是在run的时候报的, 不是在初始化数据的时候报的,可以粘下报错对应时间点的proxy和observer的日志

按照教程完成了压测,3节点主机 压测结果
Overall tpmC: 242158.80
Overall tpmTotal: 538075.80



并发客户端超过1000,吞吐量就上不去了,但是cpu 不到20%
并且教程里的优化点应该实在极端情况下做的吧,压测的时候 ocp平台是采集不到数据的。
那么在生产环境下,应该关注那些性能优化点呢?

感觉好少的tpmc.

我用3zone,6台测试有50万的tpmc

看看是不是压力机的问题。。我估计OB的压力都没起来