朝暾
#1
【 使用环境 】 测试环境
【 OB or 其他组件 】
【 使用版本 】4.2.5+
【问题描述】当表组设置为SHARDING = 'None’时,如果表组内都是非分区表,如果单台机器磁盘2000G,这台机器上表组已经占了1900G,所有表都是单表,还需要加一个200G的单表到表组,此时会失败嘛,还是之前的表连同新加的表都迁移到一台新的节点,抑或是还是SHARDING = 'None’时允许表组的不同表在不同节点。
【复现路径】问题出现前后相关操作
【附件及日志】
【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)
【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!
2 个赞
论坛小助手
#3
在这个情况下,您的问题是关于在磁盘空间几乎满载的情况下,尝试在一个设置了 SHARDING='None' 的表组中添加新的大表是否会导致失败,以及如果没有失败,新表将会如何处理。这属于资源管理和分配的问题,特别是关注于存储空间和表组策略。
由于 obdiag 目前提供的功能更多集中在诊断错误、性能问题等方面,而不是直接处理资源管理策略或配置导致的问题,因此我们可能不会直接使用 obdiag 来诊断这个问题。不过,可以先通过日志来查看是否有相关错误提示,这可能帮助我们了解操作失败的具体原因。
推荐操作
-
使用 obdiag 收集集群的基础信息,包括但不限于系统日志、错误日志等,这有助于了解当前集群的健康状态及是否存在明显的错误信息。
-
日志采集场景: 集群基础信息
-
日志采集命令:
obdiag gather scene run --scene=observer.base
问题列表
为了更准确地定位并解决您的问题,请您提供以下信息:
- 尝试添加新表时的具体错误消息是什么?
- 当前集群的版本信息是什么?
- 表组中的其他表大小情况如何?是否有接近或超过 200G 的表?
- 当前集群的存储分布情况如何?是否有其他节点拥有足够的空闲空间?
- 在尝试添加新表之前,是否进行了磁盘空间检查,确保有足够的空间来存放新表?
- 您是否启用了任何自动扩展或数据迁移的机制?
希望上述信息可以帮助我们更好地理解您的情况并提供有效的解决方案。如果您能分享日志文件或其他相关数据,将更有助于我们进行深入分析。
附上敏捷诊断工具 obdiag 使用帮助链接