OCP 告警推送 失败 【CancellationException:】

【 使用环境 】生产环境
【 OB or 其他组件 】OCP
【 使用版本 】v4.1.2
【问题描述】CancellationException:
【复现路径】部分成功,部分失败
【附件及日志】




1 个赞

会发送告警,但是无法收到告警恢复

1 个赞

是告警消息和告警恢复消息都有失败的情况 是吧?

都偶尔能成功,1比3的概率

是meta OCP元数据库的observer报这异常日志吗,OCP报警可能是要先写入meta库后再推报警到通道去,如果写meta库失败就不推报警
disk is hung(msg=“clog disk may be hung, add failure event”

1 个赞

可能ocp数据库clog盘满

1.可以使用obdiag分析下ocp数据库的日志并上传下observer.log
obidag analyze log --from xxxx --to xxxx --可分析失败前后20分钟的日志
https://www.oceanbase.com/docs/obdiag-cn

2.告警推送失败的现象是在所有类型的告警中都会出现还是特定类型的告警才会出现?
3.是否检查过 OCP 中关于钉钉告警机器人的配置是否正确?