observer日志中报错renameat failed

AntTech_GA3VJG · 2026 年1 月 12 日 16:10

集群的observer日志一直在滚动报错renameat failed，报错路径的属主、权限和可用空间均没有问题，尝试在报错路径下新建文件后修改文件名也没有问题，这是什么原因。

旭辉 · 2026 年1 月 12 日 16:26

看下磁盘空间

df -h /opt/oceanbase/data/

检查 clog 目录大小

du -sh /opt/oceanbase/data/1/obtest/clog/

AntTech_GA3VJG · 2026 年1 月 12 日 16:41

磁盘空间如下

旭辉 · 2026 年1 月 12 日 16:48

发下以下执行结果

df -i /opt/oceanbase/data/
dmesg | tail -50 | grep -i "error\|fail"
getenforce
ls -la /opt/oceanbase/data/1/obtest/clog/log_pool/ | head -10

AntTech_GA3VJG · 2026 年1 月 12 日 16:53

结果如下

旭辉 · 2026 年1 月 12 日 16:59

看下这个结果



ls /opt/oceanbase/data/1/obtest/clog/log_pool/ | wc -l


grep "renameat failed" /opt/oceanbase/log/observer.log | wc -l

AntTech_GA3VJG · 2026 年1 月 12 日 17:05

结果如下，刚才对集群进行了stop，最新observer中没有renameat报错，所以查询了今天所有的observer

AntTech_GA3VJG · 2026 年1 月 12 日 17:08

我的这个集群有三个zone，之前对zone3所在的节点进行服务下线后重新部署了oceanbase，再将zone3加入集群，模拟集群的扩缩容。这个报错应该是在扩缩容测试之后出现的。zone3上的部署和加入集群的操作如下：

旭辉 · 2026 年1 月 12 日 17:20

zone3的节点63下线后，其中的data，clog目录清空了吗？

报错日志是63的吗？其它两个节点也有吗？

AntTech_GA3VJG · 2026 年1 月 12 日 17:22

最开始报renameat failed的时候，我去zone3所在节点服务器上看了，确实不存在该报错路径下的文件（zone1和zone2上是存在的），所以我重新在zone3上挂了软链，截图如下，但是挂了软链后也还是报这个错误。

AntTech_GA3VJG · 2026 年1 月 12 日 17:23

zone3的节点63下线后，data，clog目录全部清空了，报错日志是在zone1和zone2上，zone3上没有报错

旭辉 · 2026 年1 月 12 日 17:25

麻烦跑个obdiag巡检看下

obdiag check run

AntTech_GA3VJG · 2026 年1 月 12 日 17:29

好的

AntTech_GA3VJG · 2026 年1 月 20 日 15:20

已解决，跑了巡检提示集群的新增节点数据目录和其它节点的数据目录不一致