数据库oceanbase-ce服务自动掉线

【 使用环境 】生产环境
【 OB or 其他组件 】操作系统: 麒麟V10SP3
【 使用版本 】4.3.4_bp1_x86_el8
【问题描述】集群部署后运行集群, 正常五分钟, 后面每台服务器会逐个掉线.
【附件及日志】





3 个赞

麻烦提供一份yaml文件

1 个赞

yaml.txt (2.1 KB)

1 个赞

看着 yaml文件没问题,麻烦提供一下observer日志看看什么原因导致的ob宕机

1 个赞

observer.log (47.3 MB)

1 个赞

服务器没有异常日志吧?内存有没有满?

1 个赞

目前发现从启动到现在, 只有一台没掉, 其余两台在启动的十分钟内都掉线了. 问了云商服务器配置是一样的.

1 个赞

内存充足
服务器有以下报错


1 个赞

三台机器的时钟同步做了么

1 个赞

做了ntp


1 个赞


126节点被加入到黑名单了,看着还是RPC问题查一下三个节点的时钟是否同步

1 个赞



延迟挺低的; 单节点部署也会出现这种情况, 莫名的下线.

1 个赞

单节点系统日志会报这个

1 个赞

三个节点的ip都是多少239 126还有哪个
当前observer日志未看到ob宕机时候的记录,可以提供一份包含 莫名的下线期间的日志么。

1 个赞

ip 30 目前这台是正常的, 没有掉线

1 个赞

学到了

1 个赞

学习一下。

1 个赞

学习总结经验 :+1: :+1: :+1:

用30正常节点去配置单节点, 出现同样问题
试了el7, el8版本都会出现同样问题.
yaml文件
yaml.txt (1.6 KB)
集群启动正常



掉线时服务器报错:

observer日志
observer (1).log (39.7 MB)

trap invalid opcode ” 通常是在计算机系统中执行不支持或不正确的操作指令时出现的异常
你的cpu是什么类型,是否具有avx指令集