修改memory list oceanbase无法启动

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】
【 使用版本 】4.35
【问题描述】oceanbase无法启动
【复现路径】调整规格8c48G->16G64G,修改memory limit无法启动,回退后也无法启动
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

日志采集场景: 集群无法连接
日志采集命令: obdiag gather scene run --scene=observer.cluster_down

另外,为了确定具体的问题,在此需要您提供一些信息:

  1. 您能否提供具体的错误日志或错误消息?这些信息通常可以在尝试启动OceanBase时在控制台输出或者日志文件中找到。
  2. 您能描述一下修改内存限制的具体操作步骤吗?例如,是通过配置文件还是通过命令行进行的修改?
  3. 您是否对OceanBase进行了其他配置更改或系统级别的更改(如内核参数调整)?
  4. 您可以检查并告知我们服务器当前的内存使用情况和可用内存大小吗?

推荐使用 obdiag 工具进行日志采集,并且将采集到的日志提供给我们。这个工具能够收集集群的基础信息,有助于我们分析为什么在您回退配置更改后,OceanBase仍然无法启动。请您执行上述命令并将生成的日志压缩包发送给我们,以便进一步诊断问题。

附上敏捷诊断工具 obdiag 使用帮助链接

还是按照助手提示的逐步排查看看吧

分析日志结果,磁盘还有的,也进行磁盘扩容还是无法启动。

根据您提供的日志片段和问题描述,看起来在尝试启动 OceanBase 时遇到了问题。尽管磁盘空间充足,并且已经进行了磁盘扩容,但仍然无法启动。为了更好地帮助您解决问题,我将基于现有信息进行分析。

分析与建议

  1. 内存配置问题

    • 您提到调整了规格(从8c48G到16c64G),并且修改了 memory limit 参数后无法启动。这可能意味着新的内存配置超出了系统的某些限制或与其他配置不兼容。
    • 建议:请检查并确保所有相关的内存参数(如 system_memory, data_memory, memory_limit 等)设置合理,并且不超过物理内存总量。可以参考官方文档中关于内存配置的最佳实践。
  2. 配置文件回退无效

    • 即使回退到之前的配置,OceanBase 仍然无法启动。这种情况可能是由于配置文件以外的因素导致的,例如系统级别的资源限制、内核参数等。
    • 建议:确认是否对操作系统进行了任何更改(如内核参数调整)。此外,重启整个服务器可能会清除一些临时状态,有助于排除非配置性的问题。
  3. 日志中的错误信息

    • 提供的日志片段不够清晰,但从描述来看,似乎没有明显的磁盘空间不足或其他常见错误码(如4264, 6325等)。为了更准确地定位问题,请提供完整的启动失败日志,特别是包含错误代码的部分。
    • 建议:使用 obdiag gather log 命令收集详细的日志信息,并上传完整日志以供进一步分析。
  4. 其他潜在原因

    • 如果以上步骤都不能解决问题,可能存在其他潜在的原因,比如文件权限问题、依赖服务未正常运行等。
    • 建议:检查OceanBase相关目录的文件权限,确保所有必要的服务(如OBProxy等)都处于正确状态。

后续步骤

  • 立即行动:首先按照上述建议逐一排查,尤其是内存配置和系统级别设置。
  • 长期措施:考虑建立一个测试环境来模拟生产环境的变化,在正式环境中应用之前先验证配置变更的影响。
  • 技术支持:如果经过这些检查后仍然无法解决问题,强烈建议联系 OceanBase 的官方技术支持团队获取专业帮助。他们可以根据具体情况提供更加针对性的支持。

希望这些建议能帮助您解决问题。如果有更多具体信息或遇到其他问题,请随时告知!

更多信息请查看:

  1. 日志同步问题
  2. 4000 ~ 4499
  3. 6000 ~ 6999
  4. 集群管理 FAQ
  5. 9000 ~ 9499

(小助手的答复已结束,如未能解决您的问题,请继续提问并等待其他同学的回复,谢谢!)

调整参数,单独启动observer,能登录到数据库了,
应该调整哪个让集群正常启动呢

原先是怎么调整的 是通过vi编辑yaml文件 还是通过obd cluster edit-config 编辑文件