升级OCP时,有两台OCP-agent升级失败

【 使用环境 】测试环境
【 OB or 其他组件 】OCP
【 使用版本 】4.2.1 升级至4.3.6
【问题描述】清晰明确描述问题
OCP升级完成后,提示有两条服务器的ocp-agent升级失败,目前任务还是处于升级中
【复现路径】问题出现前后相关操作
OCP由4.2.1 升级至4.3.6版本,OCP已升级成功
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!


报错截图和原因如上

@论坛小助手

根据提供的日志信息,升级OCP Agent失败的原因是因为存在多个相同名称但不同版本的OCP-Agent包,这导致系统无法确定使用哪一个版本进行升级。具体来说,日志中提到的错误信息为:

cannot get package info of ocp-agent-ce, multiple packages installed: ocp-agent-ce-4.2.1-20231208 144448.el7.x86_64,ocp-agent-ce-4.2.1-20231208 144448.el7.x86_64

要解决这个问题,您需要手动卸载多余的OCP-Agent包,确保每台服务器上只有一个版本的OCP-Agent包。具体步骤如下:

  1. 登录到出现问题的服务器。
  2. 使用以下命令列出所有已安装的OCP-Agent包:
    rpm -qa | grep ocp-agent-ce
    
  3. 卸载多余的OCP-Agent包。假设您要保留版本为4.2.1-20231208 144448.el7.x86_64的包,可以使用以下命令卸载其他版本:
    rpm -e ocp-agent-ce-4.2.1-20231208 144448.el7.x86_64
    
  4. 重新尝试OCP-Agent的升级操作。

此外,您还可以参考OCP官方文档中的相关部分,确保升级过程中的所有步骤都正确无误。

检索到的文档如下:

  1. 使用图形化界面部署 OCP
  2. 查询主机的 OCP Agent 详情
  3. 查询软件包列表
  4. OCP V3.3.0
  5. OCP V4.3.0
  6. OCP V3.1.2

删除失败,报错如上。

@论坛小助手

rpm -qa|grep ocp-agent

看下

老师,这个已经解决了,rpm -qa|grep ocp-agent 执行后存在多个包,然后强制删除,删除完成后skip跳过任务(中间需要停下ocp_agent进程并清除/home/admin/ocp_agent目录),然后再重装下目标版本的ocp_agent就可以了。