添加zone后,没有显示rootservice

【 使用环境 】生产环境
【 OB or 其他组件 】ocp observer
【 使用版本 】ocp4.2.2 obs 4.2.1.8
【问题描述】添加zone后,没有显示rootservice


【复现路径】该observe是从zone2 中释放出来,然后新加zone4,但是没有zone4 没有显示rootservice
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

日志采集场景: 有主改选或者无主选举的切主
日志采集命令: obdiag gather scene run --scene=observer.rootservice_switch

为了更好地帮助您解决新添加的 zone4 没有显示 Root Service 的问题,我们建议使用 obdiag 工具进行日志采集。上述命令将会收集与 Root Service 切换相关的诊断信息,有助于我们分析为什么新添加的 zone 没有被正确地分配 Root Service。

另外,为了确定具体的问题,在此需要您提供一些信息:

  1. 新添加 zone 的具体步骤是什么?是否遇到了任何错误或警告信息?
  2. 在 OCP 界面上添加 zone 时,是否有任何特殊的配置或设置?
  3. 其他 zones 是否正常工作,Root Service 是否在它们之间正确切换?
  4. 能否查看并提供 OBServer 日志中关于 zone4 的相关片段,特别是有关 Root Service 的部分?

请您执行上述命令,并将生成的日志压缩包提供给我们,以便进一步分析问题所在。

附上敏捷诊断工具 obdiag 使用帮助链接

看下SYS租户的资源配置,设置了几个ZONE

如果新新添加了几个ZONE,sys租户也要进行相应的扩容

根据您提供的信息和图片,看起来在添加新的 zone4 后,该 zone 没有被分配 Root Service。这可能是因为多种原因导致的,例如配置问题、资源不足或系统状态异常等。

分析与建议

  1. 检查 Zone 配置

    • 确认 zone4 的配置是否正确无误,特别是其所在的 region 和 IDC 是否与其他 zones 一致。
    • 在 OCP 中查看 zone4 的详细配置,确保它符合集群的要求。
  2. 确认资源充足

    • 核实 zone4 所需的资源(如 CPU、内存)是否已经足够,并且没有超过集群的最大限制。
    • 使用 obclient 连接到 OceanBase 数据库,执行如下 SQL 查询来检查 zone4 的资源情况:
      SELECT * FROM oceanbase.V$OB_UNITS WHERE ZONE='zone4';
      
  3. 验证 OBServer 状态

    • 确保 zone4 内的所有 OBServer 节点都处于正常运行状态。
    • 可以通过 OCP 或者直接使用 obclient 查询 OBServer 的状态:
      SELECT SVR_IP, SVR_PORT, STATUS FROM oceanbase.V$OB_ALL_SERVER;
      
  4. Root Service 分配逻辑

    • Root Service 通常会在集群初始化时自动选择一个合适的节点作为主根服务,并在后续过程中根据一定的规则进行切换。
    • 如果 zone4 没有被选中为 Root Service,可能是由于它不符合某些条件,比如网络延迟、硬件性能等因素。
    • 您可以尝试手动触发一次 Root Service 的重新选举,观察是否会将 zone4 纳入考虑范围。
  5. 日志分析

    • 收集并分析 OBServer 日志,特别是关于 Root Service 的部分,寻找任何错误提示或警告信息。
    • 使用 obdiag 工具收集诊断信息,具体命令如下:
      obdiag gather scene run --scene=observer.rootservice_switch
      
  6. 联系技术支持

    • 如果经过上述步骤仍然无法解决问题,建议联系 OceanBase 的官方技术支持团队获取进一步的帮助和支持。

总结

目前看来,zone4 没有显示 Root Service 可能是由于配置不当或者资源不足等原因造成的。请按照以上建议逐一排查,并提供更多的日志信息以便更准确地定位问题。如果您有任何疑问或需要更多帮助,请随时告知。

详情请参考:

  1. ALTER RESOURCE UNIT
  2. CDB_OB_AUX_STATISTICS
  3. DBA_OB_AUX_STATISTICS
  4. 5900.election_cpu_quota.md
  5. CREATE RESOURCE UNIT
  6. V$OB_UNITS
  7. 19500.server_balance_cpu_mem_tolerance_percent.md
  8. 22300.system_cpu_quota.md

(小助手的答复已结束,如未能解决您的问题,请继续提问并等待其他同学的回复,谢谢!)

截图中ZONE1在运维肯定不显示RS,ZONE4上没有SYS租户的资源也不会显示RS的信息,这个是正常的啊

我先扩容下sys租户的资源看下,谢谢