关于 OceanBase Leader 故障切换及后续回迁机制,说法正确的有()多选题
A. Leader 所在节点故障,其余 Follower 自动选举新 Leader 接管业务
B. 业务切换过程需要人工手动干预才能完成
C. 故障节点恢复且数据追平后,集群负载均衡可自动将 Leader 迁回原节点
D. Leader 故障切换后,会造成长时间业务中断和数据丢失
解析
- A 正确:Paxos 协议自动选主,秒级切换;
- B 错误:全程全自动,无需人工干预;
- C 正确:数据追平完成后,OB 负载均衡会自动优化分布,回迁 Leader 到原节点;
- D 错误:自动切换无长时间中断,少数派故障场景 RPO=0 无数据丢失。
答案:AC
选AC
A选项正确:这是 OceanBase 高可用机制的核心。当 Leader 节点故障后,只要集群中存活的副本数仍满足多数派(Majority),剩余的 Follower 副本就会通过 Paxos 协议自动发起选举,在秒级内选出新 Leader 并接管业务,整个过程对应用透明。
B选项错误: OceanBase 的设计目标之一就是实现高可用自动化。在满足多数派副本存活的前提下,Leader 的故障切换和选举是完全自动 的,无需任何人工干预。
C选项正确: 故障节点重启后,其数据是落后的。它会首先以 Follower 身份追平 与当前 Leader 之间的数据差异。数据同步完成后,如果集群配置了相关策略,RootService 的负载均衡模块可以自动发起“切主”操作,将 Leader 角色优雅地回迁 到原节点或更优的节点上,以恢复最初的流量分布。
D选项错误: 在少数派节点(如3副本中的1个)故障的场景下,故障切换时间非常短(生产环境通常 RTO < 30s),并且能严格保证数据零丢失(RPO=0) 。只有超过半数节点同时故障,才会造成服务不可用,此时必须人工介入,而强制恢复也可能会带来数据丢失的风险。