rootserver 信息与 config server 中 rootserver 信息不一致

【 使用环境 】生产环境
【 OB or 其他组件 】ocp、OceanBase
【 使用版本 】ocp:4.3.0-20240617185317 OceanBase 版本号:4.2.1.8
【问题描述】告警事件提醒:rootserver 信息与 config server 中 rootserver 信息不一致,经过排查没有发现配置问题,而且该告警会自动恢复,但会重复提醒,对数据库没有影响,告警是前段时间断电频繁重启之后出现的。
【复现路径】告警会自动恢复,但又会重复提醒,这期间没有更换过OCP,以下方法都检查过,没发现问题:
https://www.oceanbase.com/docs/common-ocp-1000000001127483
【SOP 系列 16】如何更换 OCP 的 IP 地址
以下是部分截图:

2 个赞

告警时段的observer.log和rootservice.log还有吗?如果有麻烦发下

2 个赞

参考这个排查下有问题吗?
https://www.oceanbase.com/docs/common-ocp-1000000001406735

2 个赞

rootservice.rar (2.8 MB)

2 个赞

observer.log.rar (16.2 MB)

2 个赞

配置正常

2 个赞
[2024-09-13 12:16:51.618881] INFO  [SHARE] operator() (ob_common_config.cpp:370) [2134][observer][T0][Y0-0000000000000000-0-0] [lt=12] Load config succ(name="obconfig_url", value="http://192.168.41.74:8080/services?Action=ObRootServiceInfo&User_ID=alibaba&UID=ocpmaster&ObRegion=obcluster01")
1 个赞

然后查下ocp上配置的obconfig_url

observer上查下:SHOW PARAMETERS LIKE ‘obconfig_url’;

在告警出现时对比下

1 个赞

上面的方法在告警时都使用过 是吧?

1 个赞

2024-09-13 12:16:51.618881] INFO [SHARE] operator() (ob_common_config.cpp:370) [2134][observer][T0][Y0-0000000000000000-0-0] [lt=12] Load config succ(name=“obconfig_url”, value=“http://192.168.41.74:8080/services?Action=ObRootServiceInfo&User_ID=alibaba&UID=ocpmaster&ObRegion=obcluster01”)
你配置的这个值 能正常访问么?

1 个赞

都检查了,配置正常

能正常访问

日志中暂未发现异常,告警仍持续出现吗?

在这个告警第一次出现之前有没有做过什么操作?

服务器被动重启过,其他没做任何操作。

我们采用的是3个OB、3个ob-ce节点+3个OCP节点架构部署,ocp采用obd部署的。

obcluster01是OB还是OB-CE?

OB

告警一直有,如下图

ocp使用的是社区版的还是企业版的?

社区版