硬盘坏了修复流程
当遇到硬盘故障时,首先需要确定具体的故障类型和影响范围。根据提供的文档,可以按照以下步骤进行修复:
-
确定硬盘故障:通过日志检查硬盘是否挂起 (hung),具体可以通过日志中的
xxx may be hung信息来确认。如果日志中有这类信息,可以进一步使用系统性能监控工具(如tsar或vsar)来查看磁盘状态。 -
排查磁盘故障:如果确定是磁盘故障,可以使用系统性能监控工具查看磁盘的使用率和负载情况。例如,使用
tsar查看磁盘的util使用率和load负载情况。如果磁盘压力过大(util90% 以上),可能需要进一步分析原因,例如是否有大量的 I/O 操作。 -
测试磁盘性能:可以使用
fio工具测试磁盘性能,例如运行以下命令:fio -filename=/data/nfs/fio_test -direct=1 -rw=randwrite -bs=2048K -size=100G -runtime=300 -group_reporting -name=mytest -
物理恢复:如果确定硬盘故障且需要进行物理恢复,可以参考以下步骤:
-
租户级恢复流程:
- RS 根据备份的数据创建需要的日志流。
- 日志流的 Leader 调度自己恢复数据和日志,Follower 从 Leader 拉取数据和日志。
- RS 检测到所有的日志流恢复完成以后,认为租户数据恢复完成。
-
表级恢复流程:
- 物理恢复辅助租户:从备份数据中恢复出辅助租户到指定时间点。
- 跨租户导表:将指定的表从辅助租户跨租户导入到目标租户。
- 清理辅助租户。
-
租户级恢复流程:
- 联系技术支持:如果以上步骤未能解决问题,建议联系 OceanBase 技术支持,提供更多详细信息以便快速定位和解决问题。
更多信息请查看:
- 磁盘报错[errcode=-4392] disk is hung
- 恢复流程