all-in-one安装OCP报错

【 使用环境 】测试环境
【 OB or 其他组件 】
【 使用版本 】4.2.1
【问题描述】使用oceanbase-all-in-one离线安装OCP到部署环节报错
【复现路径】
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)
Search plugins ok
Cluster status check ok
observer work dir cleaning ok
obproxy work dir cleaning ok
ocp-server cleaning ok
vcom destroyed
Package oceanbase-ce-4.2.1.8-108000022024072217.el7 is available.
Package obproxy-ce-4.2.3.0-3.el7 is available.
Package ocp-server-ce-4.2.1-20231208144448.el7 is available.
Generate observer configuration ok
Generate obproxy configuration ok
Generate ocp server configuration ok
Package oceanbase-ce-4.2.1.8-108000022024072217.el7 is available.
Package obproxy-ce-4.2.3.0-3.el7 is available.
Package ocp-server-ce-4.2.1-20231208144448.el7 is available.
±--------------------------------------------------------------------------------------------+
| Packages |
±--------------±--------±-----------------------±-----------------------------------------+
| Repository | Version | Release | Md5 |
±--------------±--------±-----------------------±-----------------------------------------+
| oceanbase-ce | 4.2.1.8 | 108000022024072217.el7 | 499b676f2ede5a16e0c07b2b15991d1160d972e8 |
| obproxy-ce | 4.2.3.0 | 3.el7 | 0490ebc04220def8d25cb9cac9ac61a4efa6d639 |
| ocp-server-ce | 4.2.1 | 20231208144448.el7 | 58cf72891d75a2fa7c754bafc42d336525baf0b5 |
±--------------±--------±-----------------------±-----------------------------------------+
Repository integrity check ok
Load param plugin ok
Open ssh connection ok
Generate ocp server configuration ok
Parameter check ok
Cluster status check ok
Initializes observer work home ok
Initializes obproxy work home ok
Initializes ocp-server-ce work home ok
Remote oceanbase-ce-4.2.1.8-108000022024072217.el7-499b676f2ede5a16e0c07b2b15991d1160d972e8 repository install ok
Remote oceanbase-ce-4.2.1.8-108000022024072217.el7-499b676f2ede5a16e0c07b2b15991d1160d972e8 repository lib check !!
Remote obproxy-ce-4.2.3.0-3.el7-0490ebc04220def8d25cb9cac9ac61a4efa6d639 repository install ok
Remote obproxy-ce-4.2.3.0-3.el7-0490ebc04220def8d25cb9cac9ac61a4efa6d639 repository lib check ok
Remote ocp-server-ce-4.2.1-20231208144448.el7-58cf72891d75a2fa7c754bafc42d336525baf0b5 repository install ok
Remote ocp-server-ce-4.2.1-20231208144448.el7-58cf72891d75a2fa7c754bafc42d336525baf0b5 repository lib check ok
Try to get lib-repository
[ERROR] Failed to install lib package for local

后台日志报错:
2024-09-03 16:35:31,268 ERROR wrapper (task.py:140) [e10930d3f570482aabd2b86c13742b7a] task 1 got exception
Traceback (most recent call last):
File “service/handler/ocp_handler.py”, line 780, in _do_install
Exception: deploy failed

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
File “service/common/task.py”, line 126, in wrapper
File “concurrent/futures/_base.py”, line 444, in result
File “concurrent/futures/_base.py”, line 389, in __get_result
File “concurrent/futures/thread.py”, line 57, in run
File “service/handler/ocp_handler.py”, line 784, in _do_install
Exception: deploy failed
2024-09-03 16:35:31,269 INFO wrapper (task.py:143) [e10930d3f570482aabd2b86c13742b7a] task 1 finished failed

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

1 个赞

用户问题: “使用oceanbase-all-in-one离线安装OCP到部署环节报错deploy failed,如何解决?”

根据您的描述,您在离线安装 OceanBase 并尝试部署 OCP 时遇到了问题,具体表现为部署失败(deploy failed)。这个问题可能与安装过程中的某些配置或环境设置有关。为了更准确地定位问题,建议使用 obdiag 工具来收集集群的基础信息,这将有助于我们进一步分析问题的原因。

日志采集场景: 集群基础信息
日志采集命令: obdiag gather scene run --scene=observer.base

该命令会帮助我们收集当前集群的基本配置信息和状态,以便于后续的故障排查。请您执行上述命令并将生成的日志压缩包发送给我们。

为了更好地帮助您解决问题,请您提供以下信息:

  1. 您是在哪个具体步骤上遇到 deploy failed 错误的?
  2. 报错时是否有详细的错误信息或日志提示?如果有,请一并提供。
  3. 您的系统环境是什么?包括操作系统版本、内核版本等信息。
  4. 是否有特殊的网络配置或安全策略(如防火墙设置)可能影响到部署?

以上信息将有助于我们更快地定位问题所在。感谢您的配合!

具体信息可参考以下文档:

附上敏捷诊断工具 obdiag 使用帮助链接

1 个赞

是使用的obd部署的么
建议使用obd web命令白屏化部署ocp很方便简洁

1 个赞

是使用obd web白屏安装,到最后一步部署环节报错

1 个赞

再向您确认几个问题:

  1. 在部署失败时除了deploy failed之外还有没有其他具体的错误信息或者详细描述
  2. 您使用的操作系统版本和内核版本是什么
  3. 是否存在任何网络限制比如特定端口被防火墙阻止
  4. 是否对OCP服务器进行了任何非默认的配置更改
1 个赞

obd日志提供一份看看
默认保存在安装obd的用户home路径: cd ~/.obd/log/

1 个赞

这个就是obd log报错信息

1 个赞

白屏日志提示[ERROR] Failed to install lib package for local
obd log报错显示python错误行,所以我也没法确定哪里的问题,只知道可能是安装lib包出现了问题,具体是哪个lib包也不知道

1 个赞

bd 部署的原理就是ssh到目标机器上去执行,看一下你当前运行obd的机器是否与搭建目标ocp的机器ssh通的

obd和ocp安装在一台主机上

根据您提供的日志信息,“Failed to install lib package for local” 表明在安装本地库包(lib package)时出现了问题。由于日志中没有明确指出是哪一个具体的库包安装失败,我们需要进一步排查。以下是一些可能的原因及解决办法:

可能的原因

  1. 缺少必要的依赖库:在安装过程中,某些必要的库可能没有正确安装或缺失。
  2. 权限问题:安装过程中可能因为权限不足而导致失败。
  3. 网络问题:虽然您提到是离线安装,但在某些情况下,即使本地安装也可能受到网络的影响(例如,某些库的安装脚本尝试访问外部资源)。
  4. 配置文件问题:配置文件中的某些设置可能导致安装失败。

解决方案

  1. 检查依赖库:确保所有必要的依赖库都已安装。您可以尝试手动安装一些常见的Python库,例如 numpy, pandas, requests 等,看看是否能够解决这个问题。

    pip install numpy pandas requests
    
  2. 检查权限:确保您有足够的权限来安装库包。您可以尝试使用 sudo 来运行安装命令。

    sudo pip install <package_name>
    
  3. 查看详细日志:查看更详细的日志信息,可能会有更多的线索。您可以查找 ocp_handler.py 文件中第780行附近的代码,看看是否有更多的异常信息或调试信息可以帮助定位问题。

  4. 检查配置文件:如果您有自定义的配置文件,请检查其中的设置是否正确。特别是关于库包安装路径或方法的部分。

  5. 使用 obdiag 收集更多信息:使用 obdiag gather 命令来收集更多关于系统环境的信息,以便进一步分析问题。

    obdiag gather
    
  6. 联系技术支持:如果以上方法都不能解决问题,建议联系 OceanBase 的技术支持团队,他们可以提供更专业的帮助和支持。

希望这些信息能帮助您解决问题。如果还有其他疑问或需要进一步的帮助,请随时告知。

具体信息可参考以下文档:

(小助手的答复已结束,如未能解决您的问题,请继续提问并等待其他同学的回复,谢谢!)

麻烦提供一份完整的obd日志

感谢,问题解决了

怎么解决的可以分享一下,方便以后的同学查看搜索

还是因为ssh互信的问题,最后一个节点无法免密连接导致。