全新环境部署单节点OCP4.3.5失败

【 使用环境 】测试环境
【 OB or 其他组件 】OCP+OB+PBPROXY
【 使用版本 】4.3.5OCP
【问题描述】清晰明确描述问题
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

±--------------------------------------------------------------------------------------------+
| Packages |
±--------------±--------±-----------------------±-----------------------------------------+
| Repository | Version | Release | Md5 |
±--------------±--------±-----------------------±-----------------------------------------+
| oceanbase-ce | 4.2.1.8 | 108000022024072217.el7 | 499b676f2ede5a16e0c07b2b15991d1160d972e8 |
| obproxy-ce | 4.3.4.0 | 1.el7 | fba87ccf12faba9ba599cd7b0ca4a8149d1abb0e |
| ocp-server-ce | 4.3.5 | 20250319105844.el7 | 5c670871a262a5c95649ca8e2ad4b237e2a8aa43 |
±--------------±--------±-----------------------±-----------------------------------------+
Repository integrity check ok
Load param plugin ok
Open ssh connection ok
Generate ocp server configuration ok
Initializes observer work home ok
Initializes obproxy work home ok
Initializes ocp-server-ce work home ok
Parameter check ok
Remote oceanbase-ce-4.2.1.8-108000022024072217.el7-499b676f2ede5a16e0c07b2b15991d1160d972e8 repository install ok
Remote oceanbase-ce-4.2.1.8-108000022024072217.el7-499b676f2ede5a16e0c07b2b15991d1160d972e8 repository lib check !!
Remote obproxy-ce-4.3.4.0-1.el7-fba87ccf12faba9ba599cd7b0ca4a8149d1abb0e repository install ok
Remote obproxy-ce-4.3.4.0-1.el7-fba87ccf12faba9ba599cd7b0ca4a8149d1abb0e repository lib check ok
Remote ocp-server-ce-4.3.5-20250319105844.el7-5c670871a262a5c95649ca8e2ad4b237e2a8aa43 repository install ok
Remote ocp-server-ce-4.3.5-20250319105844.el7-5c670871a262a5c95649ca8e2ad4b237e2a8aa43 repository lib check !!
Try to get lib-repository
Package oceanbase-ce-libs-4.2.1.8-108000022024072217.el7 is available.
[ERROR] Failed to create lib-repo config file
[ERROR] Failed to install lib package for local

使用的是ROOT账号!应该不会有权限问题

1 个赞

根据您提供的信息和日志内容,以下是关于全新环境部署单节点 OCP 4.3.5 失败问题的分析与解决建议:

问题分析

从日志中可以看出以下关键点:

  1. OceanBase 和 OBProxy 的安装成功

    • Remote oceanbase-ce-4.2.1.8-108000022024072217.el7-499b676f2ede5a16e0c07b2b15991d1160d972e8 repository install ok
    • Remote obproxy-ce-4.3.4.0-1.el7-fba87ccf12faba9ba599cd7b0ca4a8149d1abb0e repository install ok
  2. OCP 安装失败的关键错误

    • Remote oceanbase-ce-4.2.1.8-108000022024072217.el7-499b676f2ede5a16e0c07b2b15991d1160d972e8 repository lib check !!
    • Remote ocp-server-ce-4.3.5-20250319105844.el7-5c670871a262a5c95649ca8e2ad4b237e2a8aa43 repository lib check !!
    • [ERROR] Failed to create lib-repo config file
    • [ERROR] Failed to install lib package for local
  3. 可能的原因

    • 依赖库缺失或配置文件生成失败lib check !! 表明某些依赖库检查未通过。
    • 权限问题:虽然您提到使用的是 ROOT 账号,但可能存在某些特定路径或文件的权限问题。
    • 网络问题:如果依赖库需要从远程拉取,网络连接可能存在问题。

解决方案

1. 检查依赖库是否完整

根据日志中的提示,OceanBase 和 OCP 的依赖库检查失败。请执行以下步骤:

  • 确认 oceanbase-ce-libs 是否已正确安装:

    rpm -qa | grep oceanbase-ce-libs
    

    如果未安装,请手动安装:

    yum install oceanbase-ce-libs-4.2.1.8-108000022024072217.el7
    
  • 确认 OCP 的依赖库是否完整:

    ls /path/to/ocp/libs
    

    如果缺少某些库文件,请重新下载并解压 OCP 的软件包(参考文档片段 9 中的解压命令)。

2. 检查权限问题

尽管您使用的是 ROOT 账号,但仍需确认以下路径是否有正确的读写权限:

  • /etc/yum.repos.d/:确保可以创建或修改 .repo 文件。
  • /var/cache/yum/:确保有权限写入缓存文件。
  • /usr/local/ocp/ 或其他 OCP 安装路径:确保目录存在且可写。

您可以尝试手动创建相关文件以测试权限:

touch /etc/yum.repos.d/test.repo
echo "[test]" > /etc/yum.repos.d/test.repo

如果无法创建,请检查 SELinux 设置:

getenforce

如果为 Enforcing,可以临时关闭以测试:

setenforce 0

3. 检查网络连接

如果依赖库需要从远程拉取,请确认网络连接正常:

  • 测试到 OceanBase YUM 源的连通性:
    ping mirrors.aliyun.com
    curl http://mirrors.aliyun.com/oceanbase/
    
  • 如果网络不通,请配置本地 YUM 源(参考文档片段 9 中的离线安装方法)。

4. 查看详细日志

根据文档片段 4 的说明,提供以下日志以便进一步排查:

  • ~/.obd/log/obd~/.obd/app.log
  • OCP 部署失败的截图
  • 如果任务中心有相关日志,请下载并提供。

5. 重新部署

在修复上述问题后,重新执行部署命令:

obd cluster deploy <cluster_name> -c <config_file>

总结

根据文档库中的信息,部署失败的主要原因是依赖库检查未通过或权限问题。建议按照上述步骤逐一排查,并提供详细的日志信息以便进一步分析。如果问题仍未解决,建议联系 OceanBase 技术支持团队获取帮助。

如果您还有其他疑问,请随时补充说明!

详情请参考:

  1. 使用图形化界面部署 OCP
  2. OceanBase 集群常见问题
  3. 遇到问题如何向技术支持同学提问
  4. 使用容器升级 OCP
  5. OCP V4.0.1
  6. 使用图形化界面升级 OCP
1 个赞

applog日志:https://ep12.com/StaticFiles/s7rIP0Q8m70TLYWzc5iivd5T74eSsU02k0tG6jV2Q0m1E266jA18sOd8DUH5Dl58/Download/

obd日志:
https://ep12.com/StaticFiles/lyDQqmy5yaK3pCi61KHOCxf28x94Kt53SS55kSDYebTrVc982sy525B02EK65HzB/Download/

根据您提供的日志链接和问题描述,以下是进一步的分析与解决建议:


日志分析

1. AppLog 分析

从您提供的 applog 日志中,重点检查以下内容:

  • 依赖库加载失败:确认是否有类似 Failed to load libraryLibrary not found 的错误信息。
  • 配置文件生成失败:查找是否有关于 lib-repo config file 的详细错误描述。
  • 权限相关问题:查看是否有 Permission deniedAccess denied 的提示。

2. OBD 日志分析

obd 日志中,重点关注以下部分:

  • 依赖检查失败:查找 lib check !! 的具体原因。
  • 安装路径问题:确认是否有路径相关的错误,例如 /etc/yum.repos.d//var/cache/yum/
  • 网络连接问题:检查是否有 curlwget 请求失败的日志。

由于无法直接访问日志文件,请您提取并提供以下关键信息:

  • applog 中关于 lib-repo config file 的详细错误。
  • obd 日志中关于 lib check !! 的上下文信息。

进一步排查步骤

1. 验证依赖库完整性

根据文档片段 9 的说明,OceanBase 和 OCP 的依赖库可能未正确加载。请执行以下命令验证:

ldd $(which obd)

如果输出中有 not found 的库文件,请手动安装或修复:

yum install <missing_library>

2. 检查 YUM 源配置

确保 YUM 源配置正确无误:

  • 编辑 /etc/yum.repos.d/OceanBase.repo 文件,内容如下:
    [oceanbase]
    name=OceanBase Community Edition
    baseurl=https://mirrors.aliyun.com/oceanbase/
    gpgcheck=0
    enabled=1
    
  • 清理并刷新缓存:
    yum clean all
    yum makecache
    

3. 重新生成配置文件

尝试手动生成 lib-repo config file

obd repo generate oceanbase-ce --version 4.2.1.8
obd repo generate ocp-server-ce --version 4.3.5

如果生成失败,请提供具体的错误信息。

4. 离线安装依赖库

如果网络问题导致依赖库无法拉取,可以下载依赖包并手动安装:


总结

根据现有信息,部署失败的主要原因可能是依赖库缺失或配置文件生成失败。建议按照上述步骤逐一排查,并提供以下补充信息以便进一步分析:

  1. applog 中关于 lib-repo config file 的详细错误。
  2. obd 日志中关于 lib check !! 的上下文信息。

如果您仍有疑问或需要进一步帮助,请随时补充说明!


备注:如果问题仍未解决,建议联系 OceanBase 技术支持团队获取专业帮助。

检索到的文档如下:

  1. OceanBase 安装部署工具 V1.6.1
  2. OceanBase 数据库概述
  3. OceanBase 安装部署工具 V1.6.0
  4. OceanBase 安装部署工具 V1.6.2
  5. OceanBase 安装部署工具 V2.1.1
  6. OceanBase 安装部署工具 V2.6.0
  7. OceanBase 安装部署工具 V1.3.2
  8. OceanBase 安装部署工具 V1.3.3
  9. 日志
  10. OceanBase 安装部署工具 V1.2.1

(小助手的答复已结束,如未能解决您的问题,请继续提问并等待其他同学的回复,谢谢!)

1 个赞

缺少java环境,先部署个jiava环境

1 个赞

啊?obd部署ocp不会自动补环境吗。。。

远程镜像仓库开启会自己下载安装