我用的离线包安装-最后 OCP Express 安装失败

【 使用环境 】麒麟系统
【 OB or 其他组件 】
【 使用版本 】
【问题描述】OCP Express 安装失败
【复现路径】问题出现前后相关操作
【附件及日志】


日志:
日志.txt (56.1 KB)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

2 个赞

根据您提供的信息,OCP Express 在麒麟系统上的安装失败。以下是可能的原因及解决方法:

1. 检查日志

根据文档库中的信息,在 OCP 部署过程中,可以通过 部署日志 模块查看详细安装日志(参考:OCP 部署日志模块)。请仔细检查日志文件 m7pfiszxnddJ7OIYlZj8aG6x5HG.txt 中的错误信息,定位具体的失败原因。

  • 日志中显示了多个组件的加载和参数插件的应用过程,例如:

    [2025-05-10 16:56:30.727] [DEBUG] - Applying ocp-express-param-4.1.0 for ocp-express-4.2.2-100000022024011120.el8-e5c152ebdd65839ed5f5521ff6c73e6a29cb9e75
    

    如果在应用 ocp-express-param-4.1.0 的过程中出现异常,请重点关注这部分日志。

  • 如果日志中未明确指出错误原因,建议将日志上传至 OceanBase 社区或联系技术支持以获取进一步帮助。


2. 确认环境依赖

确保您的麒麟系统满足 OCP Express 的安装要求。以下是一些常见的依赖项:

  • Python 版本是否符合要求?如果主机未通过装机模板安装,手动安装的 Python 脚本可能导致问题(参考:文档片段 1)。
  • 是否安装了必要的软件包?例如,OCP-Agent 对中标麒麟的支持依赖于 libffi-devel.aarch64(参考:文档片段 8)。

建议重新检查并确保所有依赖项已正确安装。


3. 重新部署

如果定位到问题并修复后,可以尝试重新部署 OCP Express:

  • 在 OCP 部署界面,单击 重新部署 按钮。
  • 系统将清理当前失败的安装环境,并重新执行安装程序(参考:OCP 部署失败处理流程)。

4. 其他可能原因

  • 版本不匹配:确保使用的是与 OCP-Server 同版本的 OCP-Agent(参考:文档片段 6)。即使是 BP 版本,也推荐升级为同一版本。
  • 进程启动失败:如果 ocp_agentd 尝试多次拉起进程启动失败而不再拉起,可能是程序存在 bug 或配置问题(参考:文档片段 7)。

5. 下一步操作

如果以上方法仍无法解决问题,请提供以下信息以便进一步排查:

  • 完整的日志内容(尤其是错误部分)。
  • 当前系统的具体版本和配置。
  • 是否有其他组件(如 OBProxy、OceanBase 数据库)同时部署及其状态。

最后,您可以联系 OceanBase 的技术支持团队以获取更专业的帮助。

检索到的文档如下:

  1. 使用图形化界面部署 OCP
  2. 使用图形化界面升级 OCP
  3. OceanBase 集群常见问题
  4. 升级常见问题
  5. host_agent_version_not_same 主机 OCP-Agent 版本与预期版本不一致
  6. obagent_dead Agent 服务不可用
  7. 系统要求
  8. odp_sql_execute_failed SQL 执行失败次数超限
  9. OCP 系统常见问题
1 个赞

是否使用 root 用户?

是否有防火墙、安全策略限制某些端口(如 2883、2881、8080)

ocp-express当前已经不建议安装使用的,建议不是ocp产品