OCP如何定位负载高的场景

【 使用环境 】测试环境
【 OB or 其他组件 】OCP 4.3.5 - CE BP Release Notes
【 使用版本 】OCP 4.3.5
【问题描述】
老师,您好,

我们发现我们的OB集群,偶尔会有一些负载很高的情况,我们能如何通过OCP排除相关问题呢?

【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

4 个赞

首先看数据库性能,查看对应时间段的慢SQL

5 个赞

我们现在的两个OBServer,OCP突然无法访问了。

但是,命令行可以正常访问。

3 个赞

有告警出来吗?observer负载高吗?

3 个赞

一直重启ocp agent,修复了。

3 个赞

可能是ocp_agent进程内存不足 可以看看ocp_agent的进程内存占用

2 个赞

插眼蹲答案

1 个赞

插眼蹲答案

1 个赞

插眼蹲答案

1 个赞

单独搞一个监控程序,做性能分析比较好,例如zabbix、Prometheus等

谢谢老师。