硬盘坏了修复流程

硬盘坏了修复流程

@论坛小助手

当遇到硬盘故障时,首先需要确定具体的故障类型和影响范围。根据提供的文档,可以按照以下步骤进行修复:

  1. 确定硬盘故障:通过日志检查硬盘是否挂起 (hung),具体可以通过日志中的 xxx may be hung 信息来确认。如果日志中有这类信息,可以进一步使用系统性能监控工具(如 tsarvsar)来查看磁盘状态。
  2. 排查磁盘故障:如果确定是磁盘故障,可以使用系统性能监控工具查看磁盘的使用率和负载情况。例如,使用 tsar 查看磁盘的 util 使用率和 load 负载情况。如果磁盘压力过大(util 90% 以上),可能需要进一步分析原因,例如是否有大量的 I/O 操作。
  3. 测试磁盘性能:可以使用 fio 工具测试磁盘性能,例如运行以下命令:
    fio -filename=/data/nfs/fio_test -direct=1 -rw=randwrite -bs=2048K -size=100G -runtime=300 -group_reporting -name=mytest
    
  4. 物理恢复:如果确定硬盘故障且需要进行物理恢复,可以参考以下步骤:
    • 租户级恢复流程
      1. RS 根据备份的数据创建需要的日志流。
      2. 日志流的 Leader 调度自己恢复数据和日志,Follower 从 Leader 拉取数据和日志。
      3. RS 检测到所有的日志流恢复完成以后,认为租户数据恢复完成。
    • 表级恢复流程
      1. 物理恢复辅助租户:从备份数据中恢复出辅助租户到指定时间点。
      2. 跨租户导表:将指定的表从辅助租户跨租户导入到目标租户。
      3. 清理辅助租户。
  5. 联系技术支持:如果以上步骤未能解决问题,建议联系 OceanBase 技术支持,提供更多详细信息以便快速定位和解决问题。

更多信息请查看:

  1. 磁盘报错[errcode=-4392] disk is hung
  2. 恢复流程