ocp-server-ce 接管集群 报错软件包不存在

软件包 [name=ocp-agent-ce, version=4.3.6, architecture=] 不存在

软件包也上传了


software 下也有的

到底是为什么找不到

4 个赞

sudo curl -s -S -k -o ‘/tmp’/‘ocp-agent-ce-4.3.6-20250815135607.el7.x86_64.rpm’ ‘http://localhost:8080/api/v2/object-storage/sys-package/ocp-agent-ce-4.3.6-20250815135607.el7.x86_64.rpm

重试了几次报这个错

1 个赞

重启一下ocp试试呢

2 个赞

这里不要写localhost,要写真实地址

1 个赞

我先用 白屏创建 ocp 集群且成功接管集群。然后我想着把 config.yaml 捞出来 自己黑屏部署。走到接管的时候又不对了



软件包里明明就有
我用户 是 ec2-user 配置了互信。obd web 白屏部署一路OK没问题 集群接管成功。放到黑屏把集群起来再去 ocp 接管就报错。不是无法更新集群信息就是安装 agent 失败。一模一样的 yaml 到底有啥区别导致的???

1 个赞

跳过后 再 跳过 agent

1 个赞

你第一次安装OCP-server-ce 接管的时候都报这个错误吗? 我把企业版的OCP 替换后,就没有出现这个问题了。
我第一次安装OCP-server 后,卸载后安装ocp-server-ce 就出现你一样的问题。我又更换为OCP-server后解决。

2 个赞

确实 第一次成功 obd web 一路安装集群接管集群一点问题都没 然后 我去把 安装成的 config.yaml 给捞出来。心想黑屏部署试试再去接管。集群是建好了。就接管失败了。各种找不到软件包。我是不是应该换台干净的机器直接搞再去

2 个赞

我都是写真实地址的

2 个赞

你在OCP系统参数里面 截图看下ocp.site.url,
正常的接管集群 install ocp agent 日志如下,你的日志里面显示localhost 是不对的

1 个赞
user:
  username: ec2-user
  password:
  port: 22
oceanbase-ce:
  version: 4.2.1.8
  release: 108000022024072217.el7
  package_hash: 4285dbe242f497b8655c9b901f60c2848d555f52
  10.0.0.7:
    zone: zone1
  servers:
  - 10.0.0.7
  global:
    appname: myocp
    root_password: :|88m=iPO?pU),
    mysql_port: 2881
    rpc_port: 2882
    home_path: /home/ec2-user/oceanbase
    data_dir: /obdata/1
    redo_dir: /obdata/log1
    datafile_size: 600GB
    datafile_maxsize: 600GB
    datafile_next: 200GB
    log_disk_size: 200GB
    memory_limit: 56GB
    system_memory: 12GB
    cpu_count: '12'
    devname: eth0
    ocp_meta_tenant:
      tenant_name: ocp_meta
      max_cpu: 1.0
      memory_size: 2G
    ocp_meta_username: root
    ocp_meta_password: 4^&EUPTAS~tn#72s9z.NOO=b_C
    ocp_meta_db: meta_database
    ocp_monitor_tenant:
      tenant_name: ocp_monitor
      max_cpu: 1.0
      memory_size: 4G
    ocp_monitor_username: root
    ocp_monitor_password: gKtW+MlYrW7Aupy4iXKP)2
    ocp_monitor_db: monitor_database
    cluster_id: 1758807030
    proxyro_password: t52rAK4LFF
    ocp_root_password: WqIVNxVd1G
    ocp_meta_tenant_log_disk_size: 6G
    enable_syslog_wf: false
    max_syslog_file_count: 16
obproxy-ce:
  version: 4.3.5.0
  package_hash: 168f2fa3e36cc97f94df8baec80689f9c010ded0
  release: 3.el7
  servers:
  - 10.0.0.6
  global:
    home_path: /home/ec2-user/obproxy
    prometheus_listen_port: 2884
    listen_port: 2883
    enable_obproxy_rpc_service: false
    obproxy_sys_password: BjtPePIHm3
    skip_proxy_sys_private_check: true
    enable_strict_kernel_release: false
    enable_cluster_checkout: false
  depends:
  - oceanbase-ce
  10.0.0.6:
    proxy_id: 8034
    client_session_id_version: 2
ocp-server-ce:
  version: 4.3.6
  package_hash: a8ec6271c5b8fa11c068dd396dcba763510e2adc
  release: 20250815135607.el7
  servers:
  - 10.0.0.6
  global:
    home_path: /home/ec2-user/ocp
    soft_dir: /home/ec2-user/software
    log_dir: /home/ec2-user/logs
    ocp_site_url: http://10.0.0.6:8080
    port: 8080
    admin_password: RJ6vA7b6F-J9L[PxVWM06
    memory_size: 3G
    manage_info:
      machine: 10
  depends:
  - oceanbase-ce
  - obproxy-ce

我是用白屏部署成功的 yaml 去黑屏部署的。它为什么自己解析成 localhost 我送的明明是 http://10.0.0.6:8080 是不是与 bug

使用的obd版本发下

obd --version

3.6.0 的

我们复现看下,如果是bug,会排期修复,感谢反馈

这个问题的绕过方式是:在OCP系统参数里面修改ocp.site.url为正确地址

我再看下 我觉得我不是这个问题导致的。等会给你日志

反反复复复现 我换 root 用户安装所有了


这里也不能是127.0.0.1,ocp.site.url 也不能配置127.0.0.1,需要真实IP地址

这里是我映射到本地的端口啊 实际是 10.0.0.6

集群已经迁出了 重启的机器还卡住在这里

你发下完整的子任务日志吧,OCP系统参数里面的ocp.site.url配置也发下