OceanBase数据库使用的时候经常挂掉

我在使用OceanBase数据库的时候为什么server会断掉,差不多一两天段一次,这个要怎么排查有没有大佬知道的?

有进行其他操作吗?
麻烦发下observer.log日志。
麻烦再用obdiag 将当时时间的日志捞一下。OceanBase分布式数据库-海量数据 笔笔算数

这个日志在哪查询

我这只安装了了一个数据库,运维什么的都没有

也就是写入数据,查询数据,没有其他的操作了

配置文件里设置的路径下的log里。

五十兆,好像上传不了

observer.rar (1.5 MB)

找到最近一次observer挂掉的时间点,用obdiag analyze log 去分析日志,如果有错误日志的分析结果,把分析结果发出来。OceanBase分布式数据库-海量数据 笔笔算数

比如发生挂掉的时间点是2024年2月18日 14:00,(安装好obdiag并配置好后) 执行如下命令来分析那个时间点的日志:

obdiag analyze log --from 2024-02-18 13:30:00 --to 2024-02-18 14:00:00


麻烦你看一下,看不太明白

最后的结果发出来就行,obdiag中间的日志不需要贴出来,你看看执行完obdiag 分析后最后会有个分析结果出来。

image
这个也没什么信息啊

那说明分析这段时间的observer日志没有发现WARN、ERROR级别的错误信息。帮忙提供一下主机的信息,obdiag gather sysstat (收集主机的信息), 看看是不是主机维度有动作kill observer,比如OOM情况

另外再提供一个思路,obdiag check巡检一下这个集群,看看是否有配置上的不合理的地方


是看这个压缩包吗?

obdiag check巡检的时候有一些是警告信息,我也不太懂,能一键修复吗?

对,把这个压缩包发过来。

这个巡检的结果也发一下,我们看一下。obdiag check 巡检不提供运维操作。关于巡检指标可以看看文档:OceanBase分布式数据库-海量数据 笔笔算数

sysstat_192.168.1.218_20240218153816.zip (19.0 KB)
obdiag gather sysstat 的结果

check_report_observer_2024-02-18-15-22-48.rar (1.7 KB)
obdiag check的巡检结果