指标咨询-ocp monagent的monagent.ob.slow.sql.threshold值含义

想咨询下monagent.ob.slow.sql.threshold值100ms具体是指什么,是指monagent采集sql_audit中的数据只采集大于100ms的语句吗。

是大于100ms的SQL会在SLOW SQL中被采集到


主要控制这里采集到SQL,大于100ms的会在这里显示

实际看ocp_monitor中的数据,0.1ms的也被存入,看上去不是通过sql_audit采集,像是通过OBProxy的慢查询采集

OBPROXY中的慢SQL默认500ms的查询才会记录在obproxy_slow.log中,另外这个日志不会记录的很详细,通过OBProxy的慢查询采集是不对的,就是采集的SQL_AUDIT的信息


统计半小时内的慢查询采集,低于100ms的SQL有200多万条,比例相当大,所以感觉采集指标有些奇怪

select count(*) from ob_hist_sql_audit_sample where cluster_name=‘xxxxx’ and ob_tenant_id>1000 and REQUEST_TIME >= TIME_TO_USEC(‘2025-09-23 10:30:00’) AND REQUEST_TIME <= TIME_TO_USEC(‘2025-09-23 11:00:00’) and elapsed_time/100<100;

– 小于100ms 2166027条
– 大于100ms 646条
– 大于200ms 557条
– 大于300ms 516条

OCP的TOP SQL ,SLOW SQL ,可疑SQL等的采集均来自SQL_AUDIT,不是通过采集日志获得的

你跟那里对比觉得奇怪了

嗯嗯,理解,谢谢,另外咨询下,有办法控制monagent采集sql_audit的阈值吗,目的是控制采集的数量,目前集群太多,业务压力一大,ocp monagent就OOM,已经扩大了内存和升级到高版本OCP,依旧无法规避,业务压力峰值比较集中。