OCP无监控数据

【 使用环境 】测试环境
【 OB or 其他组件 】 OCP
【 使用版本 】4.3.5
【问题描述】OCP独立一个单机OB集群,令接入一个3节点的OB集群,压测之后,实时监控数据没有了,但是能看到之前的监控数据
【复现路径】问题出现前后相关操作

3 个赞

到 属于这个OB集群的 主机–>OCP Agent 截图看下

1 个赞

这是啥情况???

1 个赞

1 个赞

看下这里的监控,然后下载日志发下

2 个赞

HOST_LOG_host_172.31.64.11_20250926033821_20250926153821.zip (159.7 KB)

2 个赞

点下 主机进程 看下

2 个赞

1 个赞

1.ocp Agent已经异常了,这里的“最近可用时间”还停留在早上7:21分

2.看下ocp agent所在主机的的时间 和ocp server主机的时间 是否差异

1 个赞

这个agent是在跟ocp同一个机器,这个服务器的时区我改成东八区时区,但是这里为什么还是UTC时区

1 个赞

Time zone是 CST 应该没问题,date 再看下当前时间

1 个赞

1 个赞

1.你看下OCP上的历史告警 9.26 7:20左右有没有告警?
2./home/admin/ocp_agent/log 下取下 包含 9.26 7:20 左右的mgragent.log,monagent.log,agentd.log 及相应的error.log,err.log

3.服务器配置发下,ocp_monagent进程分配的内存发下

4.top -c 截图发下

1 个赞

查根因的上面的信息需要提供下,猜测是压测时内存不足或者OCP Agent内存达到阈值导致进程出现了异常,一般重启OCP Agent就可以恢复,压测时由于采集数据增多,一般需要调大ocp_monagent的内存,参考调整

https://www.oceanbase.com/knowledge-base/ocp-ee-1000000002829414?back=kb

1 个赞

服务器配置是8C64G,ocp_monagent进程 1C/2GiB

1 个赞

我先试试这个,幸苦

1 个赞

这里的 ocp agent所在主机 就是指 那个 3节点的OB集群 不是指的ocp meta集群,
我看你发的是ocp meta集群

这里是要对比ocp server和 你开头描述的“那个 3节点的OB集群”的时间

1 个赞

同一个脚本跑的,统一都改了时区,数据库里面的入库时区和主机本地的时区是一致,只有部分时区不一致,比如主机的这个页面

1 个赞

Ob agent运行正常吗?

1 个赞

学习一下

1 个赞