observer iowait高,如何去筛选是那个租户导致的

【 使用环境 】生产环境
【 OB or 其他组件 】observer
【 使用版本 】4.3.2.1
【问题描述】集群某几台iowait高告警,通过iotop查看确定是clog目录写入速度大导致磁盘瓶颈,iowait 11%,部分租户卡顿。因上面有多个租户,请问怎么判断是那个租户执行的sql导致的呢?

【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

1 个赞

推荐使用 obdiag 工具进行日志采集,以便确定具体租户及其SQL。
日志采集场景: io问题
日志采集命令: obdiag gather scene run --scene=observer.io

此外,为了更准确地定位问题,请您提供以下信息:

  1. 当前 OceanBase 集群的详细配置,特别是与磁盘I/O相关的配置。
  2. 出现 iowait 高现象的时间段,是否有特定的操作或业务高峰期?
  3. 是否可以提供在 iowait 高发时段的慢查询日志或 SQL 审计日志?
  4. 您是否已经尝试过任何解决方案,如调整参数或优化SQL?
  5. 您是否观察到了任何其他异常现象,如 CPU 使用率异常、内存使用率突增等?

附上敏捷诊断工具 obdiag 使用帮助链接

1 个赞

性能日志和系统字典联查试试看看

使用小助手推荐的obdiag收集一下信息或生成一份ash或awr报告