【 使用环境 】生产环境
【 OB 】 OceanBase
【 使用版本 】3.1.4
【问题描述】3台裸金属主机(160core700GB内存20T磁盘)组的集群,压测结果不是很理想,并发终端超过140个就开始报错了,还有优化空间么?
租户配置:
benchmark压测结果
【 使用环境 】生产环境
【 OB 】 OceanBase
【 使用版本 】3.1.4
【问题描述】3台裸金属主机(160core700GB内存20T磁盘)组的集群,压测结果不是很理想,并发终端超过140个就开始报错了,还有优化空间么?
租户配置:
按照官方的优化措施进行调整了吗?
以下是官方的优化措施,具体配置等,可以参考
https://www.oceanbase.com/docs/community-observer-cn-0000000000745129
安装oceanbases时已经调整过系统参数,压测之前已按要求给表加了索引,合并。
https://www.oceanbase.com/docs/community-observer-cn-10000000000450312 这个文档更加详细一点,包括了对ob系统内部参数的调优。另外“并发终端超过140个就开始报错了”这个看着不太符合预期,可以贴下报错的日志信息看看
看着是断连了,可以看下压测期间,客户端和服务端的进程是否还在,dmesg -T看下是不是因为memory_limit配的太大,oom了。另外可以排查下obproxy和observer的日志,看报错期间,有没有什么日志信息
你贴的这个告警,可以适当调大点ob_plan_cache_percentage。参考:https://www.oceanbase.com/docs/community-observer-cn-10000000000901638
不过这个跟并发终端超过140个就开始报错了,好像关系不是很大。我看贴的截图,断连的时候应该已经导数完了,是在run的时候报的, 不是在初始化数据的时候报的,可以粘下报错对应时间点的proxy和observer的日志
按照教程完成了压测,3节点主机 压测结果
Overall tpmC: 242158.80
Overall tpmTotal: 538075.80
感觉好少的tpmc.
我用3zone,6台测试有50万的tpmc
看看是不是压力机的问题。。我估计OB的压力都没起来