【 使用环境 】生产环境
【 OB or 其他组件 】
【 使用版本 】OBCE-4.2.1
【问题描述】监控exporter异常
【复现路径】问题出现前后相关操作
【附件及日志】监控exporter异常 异常,经常异常,
我怀疑是 内存分配问题,目前ocpmonitor 租户分配的是 4c 16g ,ocp_monagent 这个进程运行时内存 是多大,怎么查询?
像这种问题,是不是可以尝试 ./ocp_agentctl restart 重启 ,重启这个对集群有影响吗 ?
【 使用环境 】生产环境
【 OB or 其他组件 】
【 使用版本 】OBCE-4.2.1
【问题描述】监控exporter异常
【复现路径】问题出现前后相关操作
【附件及日志】监控exporter异常 异常,经常异常,
看看告警的时间段,是否同时存在 ocp agent内存超限的告警,如果存在,可以调整一下。
修改方式:
可以到主机上 /home/admin/ocp_agent/bin/ocp_agentctl config -u monagent.limit.memory.quota=4096MB
改完重启下ocp-agent
请教一下,修改ocp_agent 可以解决 ocp_monagent 的内存的问题吗?我理解这两个是不同的进程吧。
理解了,ocp_agent 有配置文件 里面限制了ocp_monagent的内存大小,改的是如下的限制吧;
limit:
cpuQuota: ${monagent.limit.cpu.quota}
memoryQuota: ${monagent.limit.memory.quota}
配置文件麻烦贴一下。
agentd.yaml
[root@ocp02 conf]# more agentd.yaml
runDir: ${ocp.agent.home.path}/run
logDir: ${ocp.agent.home.path}/log
services:
ocp_mgragent:
program: ${ocp.agent.home.path}/bin/ocp_mgragent
runDir: ${ocp.agent.home.path}/run
#kill_wait: 0s
finalWait: 5s
minLiveTime: 3s
quickExitLimit: 3
# limit:
# cpuQuota: 2.0
# memoryQuota: 1024MB
stdout: ${ocp.agent.home.path}/log/ocp_mgragent.output.log
stderr: ${ocp.agent.home.path}/log/ocp_mgragent.error.log
envs:
PATH: ${PATH}:/bin:/sbin:/usr/bin:/usr/sbin:/usr/local/bin:/usr/local/sbin
LANG: en_US.UTF-8
ocp_monagent:
program: ${ocp.agent.home.path}/bin/ocp_monagent
runDir: ${ocp.agent.home.path}/run
#kill_wait: 0s
finalWait: 5s
minLiveTime: 3s
quickExitLimit: 3
limit:
cpuQuota: ${monagent.limit.cpu.quota}
memoryQuota: ${monagent.limit.memory.quota}
stdout: ${ocp.agent.home.path}/log/ocp_monagent.output.log
stderr: ${ocp.agent.home.path}/log/ocp_monagent.error.log
envs:
PATH: ${PATH}:/bin:/sbin:/usr/bin:/usr/sbin:/usr/local/bin:/usr/local/sbin
LANG: en_US.UTF-8