桃纭
#1
【 使用环境 】 测试环境
【 OB or 其他组件 】
ob数据库4.1.2.7
【 使用版本 】
【问题描述】清晰明确描述问题
8月5号下午6点钟,进入数据库的一个库里面查一下数据,然后查询超时。进入其他的库不会有这个情况。到了第二天后,数据库登录失败。直接执行重启命令重启4-5分钟也没有重启成功。然后下发停止命令停止数据库再下发启动命令后启动才成功重启。为什么会这样
【附件及日志】
result_details.txt (77.5 KB)
log1.7z (1.6 MB)
log2.7z (1.7 MB)
zmix
#3
检查下存储是不是有问题,observer.log日志都是这个错
[errcode=-4392] disk is hung(msg=“data disk has fatal error”
辞霜
#4
看rootserver日志显示磁盘hung住了,按照楼上的建议先查一下存储是不是出问题了
桃纭
#5
不会吧,重启成功后,再去看日志一直没有报过这个错误了
辞霜
#6
查看/var/log/message日志,报错时间点前,有没有磁盘故障的信息。查看下合并状态是否正常
hung住会自行恢复的,磁盘性能可能不太好。
桃纭
#7
现在只能看出在数据库出现问题的时候硬盘io阻塞。在出现问题之前都是正常的
辞霜
#8
这里看您应该是在测试使用吧目前,ip为127.0.0.1
建议部署生产环境时候使用本机ip,存储使用ssd的
1 个赞
桃纭
#9
收到,但是不知道因为什么导致硬盘io阻塞的,这个服务器只跑了ob数据库一个服务哈
布多
#10
磁盘性能可能有问题,或者磁盘故障,推荐使用SSD,或者检查磁盘IO。参考下这个帖子:data disk has fatal error
桃纭
#11
通过工具看,是数据库的目录写入很大呀,所以说为什么数据库的写入那么大,这个服务器只运行了数据库一个服务,而且最大的时候刚好是数据库崩溃的时候
布多
#13
写入大应该是有些重试的逻辑,应该还是磁盘问题导致的。
Rinvay
#14
先看看500租户占用是否有问题,如果没问题再去排查zone的配置问题,最后再看看升级到4.2.1.8是不是会好