Obd部署ocp-agent-ce rpm包SHA1哈希值与预期不同

【 使用环境 】 测试环境
【 Ocp安装 ocp-agent-ce agent 】
【 Ocp使用版本 v 4.3.2】
【问题描述】使用obd web一键部署ocp与集群,安装ocp agent步骤报错

【附件及日志】

2024-11-05 12:01:14.024  INFO 44897 --- [manual-subtask-executor14,53bd5eb465669a27,f20e6651c8c493b0] c.o.o.e.internal.template.SshTemplate    : SSH execute end: sudo curl -s -S -k -o '/tmp'/'ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm' 'http://10.46.128.24:8080/api/v2/object-storage/sys-package/ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm' on 10.192.128.11,result:SshResult(host=10.192.128.11, username=dba, command=sudo curl -s -S -k -o '/tmp'/'ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm' 'http://10.46.128.24:8080/api/v2/object-storage/sys-package/ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm', out=, err=, extOut=null, exitStatus=0)

2024-11-05 12:01:14.063  INFO 44897 --- [manual-subtask-executor14,53bd5eb465669a27,f20e6651c8c493b0] com.oceanbase.ocp.common.ssh.SshUtils    : SSH executeCommand begin: echo 1 on 10.192.128.11

2024-11-05 12:01:14.069  INFO 44897 --- [manual-subtask-executor14,53bd5eb465669a27,f20e6651c8c493b0] com.oceanbase.ocp.common.ssh.SshUtils    : SSH executeCommand end: echo 1 on 10.192.128.11, result: SshResult(host=10.192.128.11, username=dba, command=echo 1, out=1, err=, extOut=null, exitStatus=0)

2024-11-05 12:01:14.111  INFO 44897 --- [manual-subtask-executor14,53bd5eb465669a27,f20e6651c8c493b0] com.oceanbase.ocp.common.ssh.SshUtils    : SSH executeCommand begin: sudo sha1sum '/tmp/'/'ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm' | awk '{ print $1 }' on 10.192.128.11

2024-11-05 12:01:14.124  INFO 44897 --- [manual-subtask-executor14,53bd5eb465669a27,f20e6651c8c493b0] com.oceanbase.ocp.common.ssh.SshUtils    : SSH executeCommand end: sudo sha1sum '/tmp/'/'ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm' | awk '{ print $1 }' on 10.192.128.11, result: SshResult(host=10.192.128.11, username=dba, command=sudo sha1sum '/tmp/'/'ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm' | awk '{ print $1 }', out=2d91ebde8b30a4993df636da324ac8876ca5f9c4, err=, extOut=null, exitStatus=0)

2024-11-05 12:01:14.126  INFO 44897 --- [manual-subtask-executor14,53bd5eb465669a27,f20e6651c8c493b0] c.o.o.e.internal.template.SshTemplate    : SSH execute end: sudo sha1sum '/tmp/'/'ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm' | awk '{ print $1 }' on 10.192.128.11,result:SshResult(host=10.192.128.11, username=dba, command=sudo sha1sum '/tmp/'/'ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm' | awk '{ print $1 }', out=2d91ebde8b30a4993df636da324ac8876ca5f9c4, err=, extOut=null, exitStatus=0)

2024-11-05 12:01:14.135 ERROR 44897 --- [manual-subtask-executor14,53bd5eb465669a27,f20e6651c8c493b0] c.o.o.c.t.e.c.w.subtask.SubtaskExecutor  : result not match after try 3 times

java.lang.RuntimeException: result not match after try 3 times
	at com.oceanbase.ocp.common.lang.pattern.Retry.lambda$executeUntilWithLimit$0(Retry.java:62)
	at com.oceanbase.ocp.common.lang.pattern.Retry.executeUntilWithLimit(Retry.java:93)
	at com.oceanbase.ocp.common.lang.pattern.Retry.executeUntilWithLimit(Retry.java:61)
	at com.oceanbase.ocp.common.lang.pattern.Retry.executeUntilWithLimit(Retry.java:56)
	at com.oceanbase.ocp.executor.executor.SshExecutor.downloadFile(SshExecutor.java:398)
	at com.oceanbase.ocp.executor.executor.SshExecutor.installPackage(SshExecutor.java:237)
	at com.oceanbase.ocp.service.compute.AgentInstallationTaskService.installOcpAgentRpm(AgentInstallationTaskService.java:218)
	at com.oceanbase.ocp.service.compute.AgentInstallationTaskService$$FastClassBySpringCGLIB$$f7a6037f.invoke(<generated>)
	at org.springframework.cglib.proxy.MethodProxy.invoke(MethodProxy.java:218)
	at org.springframework.aop.framework.CglibAopProxy.invokeMethod(CglibAopProxy.java:386)
	at org.springframework.aop.framework.CglibAopProxy.access$000(CglibAopProxy.java:85)
	at org.springframework.aop.framework.CglibAopProxy$DynamicAdvisedInterceptor.intercept(CglibAopProxy.java:703)
	at com.oceanbase.ocp.service.compute.AgentInstallationTaskService$$EnhancerBySpringCGLIB$$16cfc494.installOcpAgentRpm(<generated>)
	at com.oceanbase.ocp.service.task.business.host.InstallOcpAgentTask.run(InstallOcpAgentTask.java:63)
	at com.oceanbase.ocp.core.task.engine.runner.JavaSubtaskRunner.execute(JavaSubtaskRunner.java:64)
	at com.oceanbase.ocp.core.task.engine.runner.JavaSubtaskRunner.doRun(JavaSubtaskRunner.java:32)
	at com.oceanbase.ocp.core.task.engine.runner.JavaSubtaskRunner.run(JavaSubtaskRunner.java:26)
	at com.oceanbase.ocp.core.task.engine.runner.RunnerFactory.doRun(RunnerFactory.java:76)
	at com.oceanbase.ocp.core.task.engine.coordinator.work
er.subtask.SubtaskExecutor.doRun(SubtaskExecutor.java:206)
	at com.oceanbase.ocp.core.task.engine.coordinator.worker.subtask.SubtaskExecutor.redirectConsoleOutput(SubtaskExecutor.java:200)
	at com.oceanbase.ocp.core.task.engine.coordinator.worker.subtask.SubtaskExecutor.lambda$submit$2(SubtaskExecutor.java:137)
	at java.util.concurrent.FutureTask.run(FutureTask.java:266)
	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
	at java.lang.Thread.run(Thread.java:750)

Set state for subtask: 15, operation:EXECUTE, state: FAILED

请大佬帮忙看一下这个问题,多谢。 @论坛小助手

根据您提供的日志信息,问题出在 ocp-agent-ce RPM 包的 SHA1 校验值与预期不符。具体来说,下载的 ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm 文件的 SHA1 哈希值为 2d91ebde8b30a4993df636da324ac8876ca5f9c4,而系统期望的值可能不同,导致校验失败。

解决方案

  1. 重新下载 RPM 包

    • 确认下载源是否正确,并尝试重新下载 ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm 包。
    • 执行以下命令手动下载并校验:
      sudo curl -s -S -k -o '/tmp/ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm' 'http://10.46.128.24:8080/api/v2/object-storage/sys-package/ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm'
      sudo sha1sum '/tmp/ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm'
      
    • 确认输出的 SHA1 值是否与预期一致。
  2. 检查下载源

    • 确认下载 URL 是否正确,确保没有网络问题或中间件干扰。
    • 您可以尝试从其他节点或机器上下载该 RPM 包,看是否能成功。
  3. 清理缓存

    • 清理 /tmp 目录下的旧文件,确保没有残留的旧版本 RPM 包。
      sudo rm -f /tmp/ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm
      
  4. 检查 OCP 配置

    • 确认 OCP 配置中指定的 ocp-agent-ce RPM 包的版本和路径是否正确。
    • 检查 OCP 的配置文件或界面,确保没有误配置。
  5. 联系支持

    • 如果以上方法都无法解决问题,建议联系 OceanBase 的技术支持团队,获取进一步的帮助。

希望这些步骤能帮助您解决问题。如果还有其他疑问,请随时联系。[[@1]]

我本地环境试了下,和你日志里面的checksum值(2d91ebde8b30a4993df636da324ac8876ca5f9c4)确实不一致,你讲这个agent包删掉,重新下载上传再试下

$sha1sum ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm
f0454eadd8fd83b60b2496697e54501bed39fae5 ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm

好的,多谢,应该是之前部署的没有清理干净,我重新来一遍吧。

好的,重新部署前确实需要确保之前的部署环境已经清理干净。以下是清理旧部署的一些步骤,您可以参考:

  1. 清理旧的 RPM 包

    • 删除 /tmp 目录下之前下载的 ocp-agent-ce RPM 包。
      sudo rm -f /tmp/ocp-agent-ce-4.3.2-202412145836.el7.x86_64.rpm
      
  2. 卸载已安装的 ocp-agent-ce

    • 如果之前已经安装了 ocp-agent-ce,需要先卸载。
      sudo rpm -e ocp-agent-ce
      
  3. 清理 OCP 相关的配置文件

    • 删除或备份 OCP 相关的配置文件,确保没有残留的配置。
      sudo rm -rf /etc/ocp-agent
      
  4. 清理 OCP 相关的日志文件

    • 删除或备份 OCP 相关的日志文件,确保没有残留的日志。
      sudo rm -rf /var/log/ocp-agent
      
  5. 清理 OCP 相关的数据目录

    • 删除或备份 OCP 相关的数据目录,确保没有残留的数据。
      sudo rm -rf /var/lib/ocp-agent
      
  6. 清理 OCP 相关的服务

    • 确保没有残留的 OCP 服务在运行。
      sudo systemctl stop ocp-agent
      sudo systemctl disable ocp-agent
      sudo systemctl daemon-reload
      

完成以上步骤后,您可以重新开始部署 ocp-agent-ce。希望这次部署顺利!如果还有其他问题,请随时联系。 [1]

具体信息可参考以下文档:

  1. 清理旧集群
  2. 错误码
  3. 停止备份
  4. upgrade_ocp_agent_failed OCP-Agent 升级失败
  5. odp_sql_execute_failed SQL 执行失败次数超限
  6. 查看运维任务
  7. 更新服务配置
  8. 重启节点服务

(小助手的答复已结束,如未能解决您的问题,请继续提问并等待其他同学的回复,谢谢!)

今天尝试使用ocp接管OB集群,又遇到了这个问题:

2024-11-07 12:10:16.336 INFO 117300 --- [manual-subtask-executor13,2757208f7e359f98,977ac794c06bc54f] c.o.o.e.internal.template.SshTemplate : SSH execute end: sudo curl -s -S -k -o '/tmp'/'ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm' 'http://10.196.128.24:8080/api/v2/object-storage/sys-package/ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm' on 10.46.128.24,result:SshResult(host=10.196.128.24, username=dba, command=sudo curl -s -S -k -o '/tmp'/'ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm' 'http://10.196.128.24:8080/api/v2/object-storage/sys-package/ocp-agent-ce-4.3.2-20241012145836.el7.x86_64.rpm', out=, err=, extOut=null, exitStatus=0)

是不是下载软件包的端口8080 写死了? 实际上目前我的ocp 服务是在 8090端口 ,所以实际并没有下载下来 安装包,导致的sha1sum的值不同。


ocp.site.url 这里看下

好的,当时是部署完没有重启,没太注意这个选项,后续我观察下,多谢。