oceanbase参数优化

【 使用环境 】测试环境
【 OB or 其他组件 】observer4.2.5.2
【 使用版本 】
【问题描述】MySQL模式租户规格为16C/32G,使用sysbench对oceanbase租户进行压测时,发现cpu/内存未达到瓶颈,查看ocp界面性能你监控,memstore使用百分比,请求等待队列值较大,是否有对应的参数可优化?
memory_limit_percentage这些是跟内存相关的,内存应该不是瓶颈。

【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

1 个赞

推荐使用 obdiag 工具进行日志采集,以便确认具体的问题所在,并且将采集到的日志提供给我们以便进一步分析。

日志采集场景: 内存问题
日志采集命令: obdiag gather scene run --scene=observer.memory

另外,为了确定具体的问题,在此需要您提供一些信息:

  1. 当前租户的配置参数是什么样的?特别是与内存管理相关的参数设置,例如 memstore_limit_percentageminor_freeze_times
  2. 在压测过程中,memstore 使用率最高达到了多少?请求等待队列的最大值是多少?
  3. 压测的具体脚本或命令是什么?包括所使用的 sysbench 测试模型、数据量大小等信息。
  4. 除 memstore 使用率高和请求等待队列值大之外,是否还有其他异常表现?例如响应时间、吞吐量等性能指标的变化。
  5. 是否尝试过调整相关参数来观察其对性能的影响?如果有,请详细说明调整的内容及结果。
  6. 该测试环境中的硬件配置如何?例如服务器型号、网络带宽等。

附上敏捷诊断工具 obdiag 使用帮助链接

队列高可能是场景耗cpu,线程处理慢导致。并无参数优化,但是可以调大队列最大值 受集群级 配置项tenant_task_queue_size 控制。当前默认1.6w



但是租户性能监控界面的cpu使用率并不高

说实话,问题都没有太理解

就是目前使用sysbench压测,目前看监控cpu使用率不高,队列等待较高,想着能不能调整对应参数能让cpu等资源充分利用,然后压测qps结果值能更好

麻烦截图看一下当时的磁盘负载情况

这种情况用诊断工具obdiag巡检一下

执行 sysbench 时的巡检任务集合

obdiag check run --cases=sysbench_run

文档:https://www.oceanbase.com/docs/common-obdiag-cn-1000000003242092

1 个赞


看压测时集群维度的IO相关监控

好的,我试试

可以

了解

你好obdiag收集一下信息麻烦发出来一份看看。并使用sar 观察一下集群磁盘情况

学习了

这个可以有