OCP软件包上传失败

【 使用环境 】
测试环境

【 OB or 其他组件 】
OCP 4.2

【问题描述】
上传包报错

【复现路径】
反复尝试,rpm没问题,每次都报错,l
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

根据文档库中的信息,针对您在OCP 4.2版本中遇到的软件包上传失败的问题,建议按照以下步骤进行排查和解决:

  • 提供详细的日志信息:为了更准确地定位问题,请参考ocp多节点如何定位日志,找到对应的节点和trace_id,然后将完整的ocp-server.log日志附件。具体的日志位置和文件名可以在OCP的系统管理 → 系统参数中查看logging.file.name对应的值。请确保打包并提供对应报错时间段的日志以及trace_id的说明给相关的技术支持人员。

  • 检查任务日志:如果上传软件包的操作是在OCP的任务中心发起的,请在OCP 任务中心找到失败的任务,在右上方点击下载完整的任务日志和完整的任务截图(截图中需要包括完整的任务名称和报错的任务位置)。这有助于进一步分析问题所在。

此外,考虑到您提到的是测试环境中遇到的问题,并且已经确认rpm本身没有问题,那么很可能是由于环境配置或者网络连接方面的原因导致的上传失败。建议同时检查服务器之间的网络连通性以及防火墙设置,确保所有必要的端口都是开放的,并且服务器之间可以正常通信。

如果以上方法仍然无法解决问题,建议使用OceanBase敏捷诊断工具obdiag收集更详细的诊断信息,以便于后续的技术支持团队能够更快地帮助您解决问题。详情参见链接:obdiag使用指南

希望上述信息对您有所帮助!如果有任何其他疑问或需要进一步的帮助,请随时告知。

具体信息可参考以下文档:

  1. 遇到问题如何向技术支持同学提问
  2. 查询集群信息
  3. 查询所有未完成的任务
  4. 获取 subTask 的详细信息
  5. 获取 Node 的详细信息
  6. 查询 obshell 的最后一个运维任务
  7. 操作任务
  8. 获取任务的详细信息

1.麻烦确认下ocp的具体版本
2.其它版本的agent包可以上传成功吗?

ocp是ob4.3.5 allinone带进来的。

这里面的所有版本都试了,不成功,都一样

根据您提供的信息,您在OCP 4.3.5 all-in-one环境中尝试上传多个不同版本的ocp-agent-ce软件包时遇到了问题。为了更好地帮助您解决问题,请按照以下步骤进行排查:

1. 检查环境配置

确保您的测试环境中满足以下条件:

  • 网络连接:确认所有节点之间的网络连接正常,特别是上传服务器与目标服务器之间的连通性。
  • 防火墙设置:确保防火墙没有阻止必要的端口,尤其是用于文件传输和通信的端口。
  • 磁盘空间:检查目标服务器上的可用磁盘空间是否足够,以避免因空间不足导致上传失败。

2. 验证RPM包完整性

尽管您已经确认rpm本身没有问题,但建议再次验证每个rpm包的完整性和校验值(如MD5或SHA256),以确保下载过程中没有损坏。

3. 查看详细的日志信息

根据文档库中的信息,针对OCP相关的问题,需要提供详细的日志信息以便更准确地定位问题:

  • OCP日志:参考如何定位日志,找到对应的节点和trace_id,然后将完整的ocp-server.log日志附件。具体的日志位置和文件名可以在OCP的系统管理 → 系统参数中查看logging.file.name对应的值。
  • 任务日志:如果上传操作是在OCP的任务中心发起的,请在OCP 任务中心找到失败的任务,在右上方点击下载完整的任务日志和完整的任务截图(截图中需要包括完整的任务名称和报错的任务位置)。

4. 使用obdiag收集诊断信息

为了进一步分析问题,建议使用OceanBase敏捷诊断工具obdiag收集更详细的诊断信息。详情参见链接:obdiag使用指南

5. 检查OCP版本兼容性

由于您提到的是OCP 4.3.5 all-in-one版本,而尝试上传的ocp-agent-ce版本范围较广(从4.2.1到4.3.3),请确保所上传的ocp-agent-ce版本与当前OCP版本兼容。通常情况下,建议使用与OCP版本相匹配或更高版本的ocp-agent-ce

6. 尝试离线安装

如果您处于离线环境,除了克隆ocp-agent-ce安装包到本地仓库外,还需要克隆配套版本的OBAgent安装包。具体操作可以参考使用obd升级管理的服务

7. 联系技术支持

如果以上方法仍然无法解决问题,建议联系OceanBase的技术支持团队,并提供上述收集的所有日志和诊断信息,以便他们能够更快地帮助您解决问题。

希望上述信息对您有所帮助!如果有任何其他疑问或需要进一步的帮助,请随时告知。

更多信息请查看:

  1. 通过 OCP 部署 OceanBase 集群
  2. 集群性能诊断
  3. 升级 OBProxy 集群下全部 OBProxy
  4. 遇到问题如何向技术支持同学提问
  5. 通过 ODC 连接 OceanBase 数据库
  6. 使用 obd 进行运维
  7. 查询集群信息
  8. 查询状态
  9. 获取 Node 的详细信息

(小助手的答复已结束,如未能解决您的问题,请继续提问并等待其他同学的回复,谢谢!)

那OCP应该是 433版本,麻烦进行下上传操作,然后发下 ocp-server.log和ocp.log

也可以换个浏览器试试看

这个解决了吗?如果没解决麻烦发下日志

肯定不是浏览器的问题,尝试了无数遍,后来增加内存16 → 24后倒是安装成功了,(虽然依然报内存不足)