磁盘报错hung

架构1-1-1
独立data盘
独立redo盘
cpu16c 内存32G
磁盘ssd

observer报错:[2025-02-26 17:36:01.518345] ERROR [USING_LOG_PREFIX] detect_palf_hang_failure_ (ob_failure_detector.cpp:374) [9967][T1002_Occam][T1002][Y0-0000000000000000-0-0] [lt=20076][errcode=-4392] disk is hung(msg=“clog disk may be hung, add failure event”, clog_disk_hang_event={type:PROCESS HANG, module:LOG, info:clog disk hang event, level:FATAL}, clog_disk_last_working_time=1740562555275850, hung time=5859542)

磁盘性能可能有问题,或者磁盘故障 简单测试下性能看看:
fio -filename=/data/nfs/fio_test -direct=1 -rw=randwrite -bs=2048K -size=100G -runtime=300 -group_reporting -name=mytest -ioengine=libaio -numjobs=1 -iodepth=64 -iodepth_batch=8 -iodepth_low=8 -iodepth_batch_complete=8

1 个赞

调整 磁盘监控 到几秒一次,捕获一下看看。
或者 搜索下载 tsar 软件,然后 用 tsar 实时监控记录磁盘 wawait 和 svctm 指标。

ssd,io等待高达4.7,不知道咋回事

1 个赞

可以确定一下io等待高的进程 iotop可以看一下