【告警误报】服务器时钟同步服务不存在

【 使用环境 】生产环境 or 测试环境
生产环境
【 OB or 其他组件 】
OB\OCP\OMS
【 使用版本 】
4.2.3.0
【问题描述】清晰明确描述问题
服务器上正常运行了 NTPD服务 ,但还是会有服务器时钟同步服务不存在的告警:


以按照下文进行排查:


image

【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

你好,39是ocp服务器,99、100是observer服务器吗,每台机器上的时钟进程是否正常,也可以通过ocp上手动触发时钟同步后,再观察下

36/37/38/41是 ob
39 是 ocp
40 是 oms
99/100是授时服务器

每个服务器上的时钟进程都正常。手动触发指的是啥?ntpdate [ntp-server]?

https://www.oceanbase.com/docs/common-ocp-1000000000585484
问题是查看ntp服务是正常的,但是OCP上出现了这个时钟服务不存在的告警,可以先按照这文档排查下,如果确保不是时钟的问题,理解是OCP上面误告警了,可以重启下ocp-agent或者将这个告警屏蔽下


ntp和 chrony 是不是只要存在一个就可以?

测试重启 ocp-agent,没有效果,仍然告警。
分析告警触发,我猜测可能是取值搞反了,理应是:
1----代表服务正常;
0----代表服务不存在。

当前ocp什么版本呢,

OCP agent 中的日志应该有检查 NTP 服务的命令,可以确认一下看看,是不是agent的命令检查不到

4.2.2

我重启了ntpd和ocp agent,然后告警消失。到目前为止还没有复现出来。
再观察一段时间,看会不会复现。如果有的话,我按您的方法检查一下。

好的