【OceanBase 4.x DBA 进阶教程】《故障应急手册》内容预告

DBA 进阶教程的背景和大目录详见: 【OceanBase 4.x DBA 进阶教程】用户意见收集

我们的内容持续更新了一段时间,终于来到了 “问题排查” 阶段, 详见:GitBook 中的《OceanBase 4.x DBA 进阶教程》

前一段儿时间看了 @洪波 大佬整理的一篇社区博客《OceanBase 应急三板斧》,以及文档团队的小伙伴们在官方文档中为大家提供的一些和应急处理相关的内容,内容都非常不错。

不过这些应急场景和应对手段,对于社区版的用户来说,可能内容还不是特别完善,同时也不够体系化、图谱化。

同时考虑到用户意见收集中的 @oceanvoice@张雨齐 等老师的建议,准备《进阶教程》的下一部分为大家提供一份儿相对比较成体系,也更加全面的《故障应急手册》。


在《故障应急手册》中,会把用户在使用 OceanBase 的过程中可能遇到的问题,以及对应的解决方案进行汇总,目录大致会是:

《故障应急手册》

  • 1 系统响应时间不符合预期
  • 2 SQL 执行报错
  • 3 CPU 负载异常
  • 4 节点宕机
  • 5 生产库故障切容灾库
  • 6 硬件 & 基础环境故障应急处理
  • 7 负载变化导致的问题
  • 8 集群内部其他问题
    • 8.1 租户转储阻塞
    • 8.2 集群合并阻塞
    • 8.3 SYS 租户/ RS 服务问题
    • 8.4 磁盘泄漏
    • 8.5 内存泄漏
    • 8.6 长事务
    • 8.7 悬挂事务
    • 8.8 coredump
    • 8.9 无主
  • 未完待续
4 个赞

在不出意外的前提下,手册的更新频率大概会是一周一次,希望大家能够持续关注。

3 个赞

同时,也希望大家能够留言评论你希望在这个手册中增加的内容。

2 个赞

:+1: :+1: :+1:

:+1: :+1: :+1:
期待

厉害了 :+1: