社区版4.3.0 OCP 可不可以取消集群级别或者租户级别的慢SQL采集

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】社区版4.3.0 OCP
【 使用版本 】社区版4.3.0 OCP
【问题描述】社区版4.3.0 OCP 主机出现了很大的网络流量,想把慢SQL等采集功能关闭,有关闭的方法步骤吗
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

用户问题: “如何在社区版4.3.0 OCP中关闭集群级别或租户级别的慢SQL采集以减少网络流量?”

根据您的描述,您希望在社区版的 OceanBase Cloud Platform (OCP) 中关闭慢SQL (SlowSQL) 的采集功能,以减少网络流量。这表明您当前关注的是配置和管理 SQL 相关的功能,而非具体的数据库运行时的技术问题。因此,这个问题并不直接对应于 obdiag 工具所支持的日志采集或根因分析的具体技术场景。

不过,为了更好地理解您的需求并提供进一步的帮助,请您提供一些额外的信息:

  1. 您是否尝试过在 OCP 的配置界面中查找与慢SQL采集相关的设置选项?
  2. 您是否有查看过 OCP 的官方文档或社区论坛,寻找关于关闭慢SQL采集的相关指导?
  3. 您是否知道具体的慢SQL采集配置项名称或路径?

由于您的问题涉及的是 OCP 管理界面中的配置调整,而不是具体的数据库故障诊断,所以这里不适用 obdiag 的日志采集或根因分析功能。如果您在配置过程中遇到了具体的技术难题,或者需要进一步的帮助,请提供更多详细信息,我们将尽力协助解决。

检索到的文档如下:

  1. 租户性能诊断
  2. 诊断分析

附上敏捷诊断工具 obdiag 使用帮助链接

我查了相关资料,ocp4.x没有直接的开关可以关闭SQL采集,我再咨询下ocp相关老师,有进展回复你;
另外,生产环境是不建议取消SQL采集等的。正常情况下流量不会很大,要具体查一下大流量主要在哪一块。

好的,目前网络流量很难排查到原因,而且服务器上主要就是OCP和metadb,要考虑关闭慢SQL采集看一下网络情况,在进行排查原因

理解您的情况后,考虑到您希望通过关闭慢SQL采集来观察网络流量的变化,进而排查问题。然而,根据检索到的文档信息 [1],社区版 OCP 当前暂不支持直接关闭慢SQL采集的功能。这意味着在现有配置中,您可能无法直接找到一个开关来停止慢SQL的采集。

尽管如此,您可以尝试以下替代方案来间接达到减少网络流量的目的:

  1. 调整慢SQL采集的阈值:虽然不能直接关闭慢SQL采集,但您可以尝试调整慢SQL的定义标准,例如增加慢SQL的执行时间阈值,使得只有真正“慢”的SQL才会被采集。这样可以减少被采集的SQL数量,从而降低网络流量。具体的调整方法需要查阅 OCP 的相关文档或通过 OCP 的管理界面进行探索。

  2. 临时禁用OCP的某些功能模块:如果可能的话,您可以尝试与 OceanBase 的技术支持团队联系,询问是否有办法临时禁用OCP中的某些功能模块,包括慢SQL采集相关的部分。这可能涉及到更深层次的系统配置调整,因此建议在专业指导下进行。

  3. 使用防火墙或其他网络管理工具:作为另一种思路,您也可以考虑使用服务器上的防火墙规则或其他网络管理工具来暂时限制或过滤掉与慢SQL采集相关的网络流量。这种方法虽然不能从根本上解决问题,但在短期内可以帮助您观察网络流量的变化趋势。

最后,如果以上方法均不可行,建议您联系 OceanBase 的官方支持团队,他们可能能够提供更专业的建议或解决方案。同时,您也可以考虑升级到支持更丰富功能的企业版 OCP,以便获得更多的管理和监控选项。

更多信息请查看:

  1. os_cpu_irq_error 服务器 CPU 软中断未打散
  2. tenant_cpu_percent_over_threshold OceanBase 租户线程使用率超限
  3. ocp_http_request_timeout OCP HTTP 接口请求超时
  4. tenant_active_memstore_percent_over_threshold OB 租户活跃内存百分比超限
  5. ob_tenant_cpu_usage_over_threshold OceanBase 租户 CPU 使用率超限
  6. os_observer_fd_usage OB server 打开句柄过多
  7. 分析响应时间突然抖动的 SQL
  8. oas_anomaly_sql_from_anomaly_event_analysis_perf_degradation 主机 CPU 超限根因分析,SQL 性能下降
  9. os_tsar_nvme_ioawait OBserver 节点 NVMe 磁盘 ioawait 高
  10. 查询 SQL 流量分布情况及 QPS

(小助手的答复已结束,如未能解决您的问题,请继续提问并等待其他同学的回复,谢谢!)

社区版OCP可以调整对SQL的采集策略吗,例如能否只采集执行时间大于50ms的SQL,像TOPSQL只收集大于50ms的SQL

1 个赞

功能有吗,老师

了解到ocp 4.3.2版本开始有这个配置,你升级下看看

ocp的SQL诊断中 TopSQL,可疑SQL, SlowSQL, ParallelSQL其数据来源是gv$ob_sql_audit(4.x),可以通过调整ocp.ob.slowsql.threshold 来调整ob-agent采集OB集群的慢查询时间阈值
可以参考下
https://www.oceanbase.com/docs/common-ocp-1000000001406387

请教一下,这个OCP参数调整完适用于TopSQL,可疑SQL, SlowSQL, ParallelSQL这四个指标是吗

Top Sql:obstat 每30秒采集一次,将相同SQL ID的sql_audit记录聚合成一行数据存入monitordb中
可疑SQL:每5分钟调度一次,检测诊断时间段内是否有执行行为异常或者索引存在问题的SQL

以及 SlowSQL, ParallelSQL采集频率都不支持调整,

另外430有个整体开关可以关闭SQL采集,白屏不支持分批关:

升级到432以后可以分批关

430你可以先整体关闭SQL采集,观察下流量