命令部署ocp后启动报错

【 使用环境 】测试环境
【 OB or 其他组件 】ocp
【 使用版本 】ocp4.3.5 ob4.2.5
【问题描述】
Please execute obd cluster start mhsb_nbk_ocp to start
Trace ID: 0c105128-0b7c-11f0-b236-9016baea23f4
If you want to view detailed obd logs, please run: obd display-trace 0c105128-0b7c-11f0-b236-9016baea23f4
(base) [root@localhost example]# obd cluster start mhsb_nbk_ocp
Get local repositories ok
Load cluster param plugin ok
Open ssh connection ok
Check before start ocp-server-ce ok
Start ocp-server-ce ok
[ERROR] failed to start 192.168.0.139 ocp-server-ce
See https://www.oceanbase.com/product/ob-deployer/error-codes .
Trace ID: 3ab6d416-0b7c-11f0-8e56-9016baea23f4
If you want to view detailed obd logs, please run: obd display-trace 3ab6d416-0b7c-11f0-8e56-9016baea23f4
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)
image
image

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

根据您提供的信息,OCP 在启动时遇到了问题。以下是可能的原因及解决方法:

1. 检查日志

  • 根据错误提示,您可以运行以下命令查看详细的日志信息:
    obd display-trace 3ab6d416-0b7c-11f0-8e56-9016baea23f4
    
    这将帮助您定位具体的错误原因。

2. 错误原因分析

根据文档中的信息,以下是一些可能导致 OCP 启动失败的常见原因及解决方法:

(1) OCP 启动用户不存在

  • 如果 OCP 启动用户不存在,可能会导致启动失败。
  • 解决方法:请参考《OCP 云平台》文档 用户规划,在 OCP 所在主机上创建启动用户。(依据:文档片段 1)

(2) 组件版本不匹配

  • 如果部署 OCP 时使用的组件版本不正确,可能会导致启动失败。
  • 解决方法:执行以下命令修改配置文件中对应组件的版本(version),保存后执行命令行中输出的命令使修改生效:
    obd cluster edit-config mhsb_nbk_ocp
    
    (依据:文档片段 5 和 文档片段 7)

(3) OCP Agent 状态异常

  • 如果 OCP 中的主机状态为“离线”或“新提交”,可能会导致启动失败。
  • 解决方法:
    • 查询当前 OCP 管理主机的状态,详细操作可参见《OCP 云平台》文档 管理主机操作列表
    • 如果主机状态为“离线”,可以尝试重装 OCP Agent,详细操作可参见《OCP 云平台》文档 重装 OCP Agent。(依据:文档片段 6)

(4) 程序 Bug

  • 如果 ocp_agentd 存在 Bug,可能会导致进程启动失败。
  • 解决方法:请确保使用的是最新版本的 OCP 和 OB,并检查是否有相关的修复补丁。(依据:文档片段 8)

3. 重新部署

  • 如果上述方法无法解决问题,您可以尝试清理当前失败的 OCP 安装环境并重新部署:
    obd cluster redeploy mhsb_nbk_ocp
    
    (依据:文档片段 2、文档片段 3 和 文档片段 4)

4. 联系技术支持

  • 如果问题仍未解决,请参考日志信息获取失败原因,并联系 OceanBase 技术支持团队进行处理,或到官网 问答区 提问。(依据:文档片段 2)

总结

请按照上述步骤逐一排查问题。如果仍有疑问,建议提供更详细的日志信息以便进一步分析。

详情请参考:

  1. 错误码
  2. 通过图形化界面部署 OCP
  3. 使用图形化界面部署 OCP
  4. obagent_dead Agent 服务不可用
  5. OceanBase 安装部署工具 V2.8.0
  6. 使用图形化界面升级 OCP

OceanBase 社区已接收您的帖子,正在跟进中。

问题已解决:

启动时日志未发现启动明确失败信息。

1)使用命令启动ocp-server 服务(obd日志中能查看到命令)
***** 更换 对应密码
export JDBC_PASSWORD=****** 更换为: ocp_meta 租户的密码
OCP_INITIAL_ADMIN_PASSWORD=****** 更换为: ocp白屏登录的密码
ocp.iam.encrypted-system-password=****** 更换为: oceanbase
–with-property=ocp.monitordb.password:****** 更换为: ocp_monotir 租户的密码

cd /disk_d/oceanbase/ocp/mhsb_ocp_nbk/admin/ocp; export JDBC_URL=jdbc:oceanbase://xx.xx.xx.xx:2891/meta_database; export JDBC_USERNAME=root@ocp_meta;export JDBC_PASSWORD=****** export JDBC_PUBLIC_KEY=;export OCP_INITIAL_ADMIN_PASSWORD=******;java -Dfile.encoding=UTF-8 -jar -Xms4g -Xmx4g -Docp.iam.encrypted-system-password=****** /disk_d/oceanbase/ocp/mhsb_ocp_nbk/admin/ocp/lib/ocp-server.jar --bootstrap --with-property=server.port:8096 --with-property=logging.file.max-size:100MB --with-property=ocp.logging.file.total.size.cap:1GB --with-property=ocp.monitordb.host:192.168.0.139 --with-property=ocp.monitordb.username:root@ocp_monitor --with-property=ocp.monitordb.port:2891 --with-property=ocp.monitordb.password:****** --with-property=ocp.monitordb.database:monitor_database --with-property=logging.file.name:/disk_d/oceanbase/ocp/mhsb_ocp_nbk/logs/ocp-server.log --with-property=ocp.site.url:[http://192.168.0.139:8080](http://192.168.0.139:8080/) --progress-log=/disk_d/oceanbase/ocp/mhsb_ocp_nbk/logs/bootstrap.log --with-property=obsdk.ob.connection.mode:direct --with-property=ocp.iam.login.client.max-attempts:60 --with-property=ocp.iam.login.client.lockout-minutes:1 --with-property=ocp.file.local.built-in.dir:/disk_d/oceanbase/ocp/mhsb_ocp_nbk/admin/ocp/ocp-server/lib --with-property=ocp.log.download.tmp.dir:/disk_d/oceanbase/ocp/mhsb_ocp_nbk/admin/ocp/logs/ocp --with-property=ocp.file.local.dir:/disk_d/oceanbase/ocp/mhsb_ocp_nbk/software
  1. 输出打印信息长时间处于initialize ocp datasource ,即 初始化ocp元数据库系统表。

3)查看ocp初始化日志 bootstrap.log,简单的 几条 insert 插入耗时2s。

4)磁盘性能 iostat -x 1,磁盘await延迟比较高,使用的机械盘

5)更换SSD磁盘后,1分钟完成初始化,启动ocp正常。