节点离线处理

集群中有一个节点因为意外断电而宕机。在节点恢复并重新加入集群的过程中,OceanBase 会自动处理数据的重新负载均衡吗?在此期间,业务读写是否会受到影响?如何手动检查节点同步的进度?

1 个赞

@论坛小助手

在OceanBase集群中,当节点因意外断电而宕机并在恢复后重新加入集群时,OceanBase会自动处理数据的重新负载均衡。这一过程中,业务读写可能会受到短暂的影响,但影响的时间取决于集群的自动恢复能力以及数据重新同步的速度。为了最小化影响,可以采取以下措施:

  1. 在节点恢复后,可以手动检查节点同步进度。使用SQL查询语句来获取当前节点的状态和同步进度:
SELECT * FROM oceanbase.__all_server WHERE svr_ip='<节点IP>' AND svr_port=<节点端口>; 

这将返回包括同步进度在内的详细信息。也可以通过OCP平台提供的界面来监控节点的状态和同步进度。
2. 如果同步过程中业务读写受到明显影响,建议监控集群的慢查询和系统资源使用情况,必要时对业务流量进行限流或转移。
3. 在确认同步完成之后,可以使用SQL语句查询Root Service的主节点来进一步验证节点的状态:

SELECT svr_ip as RootService FROM oceanbase.DBA_OB_SERVERS WHERE with_rootserver='yes';

更多信息请查看:

  1. 节点宕机
  2. 节点故障的自动处理
  3. 使用命令行进行运维