OBServer节点CPU突然飙升至100%,导致整个集群卡住

【 使用环境 】生产环境
【 OB or 其他组件 】OB
【 使用版本 】Server version: 5.6.25 OceanBase 3.1.1 (r1-ad3164d5e72df996e11f9ab1738f577c3b9ff2ce) (Built Oct 12 2021 12:36:51)
【问题描述】线上集群最近经常发生某个节点CPU飙升至100%,导致整个集群完全卡住的情况,请问如何排查?
【复现路径】比较难以复现
【附件及日志】

使用per top -p 查看具体的函数调用,看看cpu耗费在哪里。
也可以通过 SQL Audit看看有什么情况: OceanBase分布式数据库-海量数据 笔笔算数

这个是早期的obd黑屏搭建的,有具体的操作步骤么?

3.1.1版本的

v$sql_audit -OceanBase 数据库-OceanBase文档中心-分布式数据库使用文档

sql审计被关闭了,show parameters like ‘%enable_sql_audit%’;的执行结果如下:


这个是否很占用资源?

看截图是5月18号出现的问题,后续遇到后可以使用 perf record 和 obdiag收集obstack信息。

社区版在今年6月底会停止3.x的版本的bugfix版本发布,建议及时逻辑升级到4.2.1.x版本。

2 个赞