observer进程CPU占用1000%

AntTech_HQAXG2 · 2026 年6 月 24 日 16:05

【使用环境】生产环境
【 OB or 其他组件】observer
【使用版本】4.5.0.0
【问题描述】observer cpu 占用高
【复现路径】
【附件及日志】obdiag gather scene run --scene=observer.cpu_high

@论坛小助手
【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试，在发帖时输入 [@论坛小助手] 即可召唤小助手，欢迎试用！

论坛小助手 · 2026 年6 月 24 日 16:06

根据您的描述，OceanBase 遇到了CPU使用过高的问题。您已经采取了非常正确的第一步措施，即使用 obdiag 收集相关数据，这有助于我们深入分析根本原因。在您提供的gv$ob_sql_audit表信息的基础上，我们还可以进一步利用 obdiag 进行更详细的诊断。以下是我的建议：

根因分析场景: CPU高
根因分析命令: 目前直接针对CPU高没有特定的RCA（Root Cause Analysis）命令，但可以先从收集到的日志入手分析。

日志采集场景: CPU高
日志采集命令: obdiag gather scene run --scene=observer.cpu_high
这条命令将帮助收集与CPU使用率相关的更多信息，如系统活动、进程状态等，以便更好地定位导致CPU占用异常的原因。

既然您已经完成了部分数据的收集，请按照上述日志采集命令操作后提供新的日志压缩包。如果您已经执行了这个命令并获得了文件，请上传这些文件给我们，这样可以帮助进行下一步的具体分析。

为了进一步缩小问题范围，还请您补充以下几项信息：

基于以上信息，我们将能够更精确地判断问题所在，并提出相应的解决方案。感谢您的配合！

淇铭 · 2026 年6 月 24 日 16:35

有ocp么可以通过ocp查看一下top sql信息按照cpu占比排一下序

集群控制台-性能监控-主机性能， 点击监控下钻 可以看到每个 OBServer的 CPU 使用率。

AntTech_HQAXG2 · 2026 年6 月 24 日 16:49

淇铭 · 2026 年6 月 24 日 17:17

从下转分析的结果cpu使用率来看并不高呀从linux负载来看有点高你们物理服务器是多少核呀

AntTech_HQAXG2 · 2026 年6 月 24 日 17:19

32核

淇铭 · 2026 年6 月 24 日 17:22

从cpu的使用率来看 cpu没有耗尽现在使用有什么问题么？你从那里看到的cpu占比1000% 截图看看

通过ocp查看一下top sql信息按照cpu占比排一下序

AntTech_HQAXG2 · 2026 年6 月 24 日 17:35

淇铭 · 2026 年6 月 24 日 17:58

32核的话主机的负载看着也是可以从ocp的监控租户下cpu使用率来看也没有耗尽可以观察观察ocp上的租户下的cpu使用率如果不超过95% 应该没有啥问题

AntTech_MSPSKN · 2026 年6 月 25 日 08:09

学到了。

没落的星辰 · 2026 年6 月 25 日 16:35

top 显示 observer CPU 达到 1000%，对应多核多线程正常满负载，只要租户 CPU 使用率低于 95%，业务无影响就无需处理。

AntTech_MSPSKN · 2026 年6 月 26 日 08:10

点赞~~

sheldon_xuan · 2026 年6 月 26 日 08:34

厉害，学到了

longzh85 · 2026 年7 月 1 日 13:54

这么大压力