社区版ob4.2.5告警observer坏盘

该不会用的机械盘吧

1 个赞

这个是固态盘

1 个赞

之前有遇到,这次报错没有遇到

老师看到有网卡的报错

磁盘io看着没问题,其实是没什么访问量的库,固态盘


iowait告警,然后就磁盘坏盘告警


数据库看着其实很闲

使用的是什么盘,机械盘么

查询下 select * from __all_virtual_disk_stat;
看下message日志是否有坏盘告警


这个是查询信息

老师我想问下,是不是有什么标准来判断坏盘



磁盘是ssd

这边看到tsar的信息,这些值很高,从ocp上面看到又很空闲

__all_virtual_disk_stat中磁盘损坏检查策略是
对读请求,重试6次读超时(超时时间指数增加),则标记为坏盘.
对写请求,1分钟100次写失败,则标记为坏盘。
字段is_disk_valid为0表示损坏,你这里是为未损坏状态。
麻烦提供一份observer日志看看

看上去网卡和必然都有点错误

使用obdiag收集下7.14 9:35~9:45的日志 发下

observer.log.tar.gz (33.5 MB)

这个是新告警点的日志

看日志,磁盘一直在hung住,重启一下改节点的主机试试吧

可能是短暂io挂起,导致认为盘无法读写,判断坏了吧

学习了