监控exporter异常

【 使用环境 】生产环境
【 OB or 其他组件 】
【 使用版本 】OBCE-4.2.1
【问题描述】监控exporter异常
【复现路径】问题出现前后相关操作
【附件及日志】监控exporter异常 异常,经常异常,


我怀疑是 内存分配问题,目前ocpmonitor 租户分配的是 4c 16g ,ocp_monagent 这个进程运行时内存 是多大,怎么查询?
像这种问题,是不是可以尝试 ./ocp_agentctl restart 重启 ,重启这个对集群有影响吗 ?

  1. ocp_monagent 的内存应该是限制在1G,现在用了多少那只能 ps 进程来查一下看看
  2. 可以重启agent,对集群没有影响

看看告警的时间段,是否同时存在 ocp agent内存超限的告警,如果存在,可以调整一下。

修改方式:
可以到主机上 /home/admin/ocp_agent/bin/ocp_agentctl config -u monagent.limit.memory.quota=4096MB

改完重启下ocp-agent

请教一下,修改ocp_agent 可以解决 ocp_monagent 的内存的问题吗?我理解这两个是不同的进程吧。

理解了,ocp_agent 有配置文件 里面限制了ocp_monagent的内存大小,改的是如下的限制吧;
limit:
cpuQuota: ${monagent.limit.cpu.quota}
memoryQuota: ${monagent.limit.memory.quota}

貌似不生效。设置了2G ,但是内存还是使用了2.6GB ,不知道 我这样设置对不对?

这个是内存配置小了还是 就只是个告警?

重启了 ocp_monagent ,观察了一周 问题又出现了。
并且这次伴随着“服务器Agent内存超限”一起出现,不知道这两个有没有直连的联系?

配置文件麻烦贴一下。

agentd.yaml

[root@ocp02 conf]# more agentd.yaml

runDir: ${ocp.agent.home.path}/run
logDir: ${ocp.agent.home.path}/log
services:
  ocp_mgragent:
    program: ${ocp.agent.home.path}/bin/ocp_mgragent
    runDir: ${ocp.agent.home.path}/run
    #kill_wait: 0s
    finalWait: 5s
    minLiveTime: 3s
    quickExitLimit: 3
#    limit:
#      cpuQuota: 2.0
#      memoryQuota: 1024MB
    stdout: ${ocp.agent.home.path}/log/ocp_mgragent.output.log
    stderr: ${ocp.agent.home.path}/log/ocp_mgragent.error.log
    envs:
      PATH: ${PATH}:/bin:/sbin:/usr/bin:/usr/sbin:/usr/local/bin:/usr/local/sbin
      LANG: en_US.UTF-8

  ocp_monagent:
    program: ${ocp.agent.home.path}/bin/ocp_monagent
    runDir: ${ocp.agent.home.path}/run
    #kill_wait: 0s
    finalWait: 5s
    minLiveTime: 3s
    quickExitLimit: 3
    limit:
      cpuQuota: ${monagent.limit.cpu.quota}
      memoryQuota: ${monagent.limit.memory.quota}
    stdout: ${ocp.agent.home.path}/log/ocp_monagent.output.log
    stderr: ${ocp.agent.home.path}/log/ocp_monagent.error.log
    envs:
      PATH: ${PATH}:/bin:/sbin:/usr/bin:/usr/sbin:/usr/local/bin:/usr/local/sbin
      LANG: en_US.UTF-8