群通知
2025 年3 月 28 日 10:56
#1
【 使用环境 】测试环境
【 OB or 其他组件 】ocp
【 使用版本 】ocp4.3.5 ob4.2.5
【问题描述】
Please execute obd cluster start mhsb_nbk_ocp
to start
Trace ID: 0c105128-0b7c-11f0-b236-9016baea23f4
If you want to view detailed obd logs, please run: obd display-trace 0c105128-0b7c-11f0-b236-9016baea23f4
(base) [root@localhost example]# obd cluster start mhsb_nbk_ocp
Get local repositories ok
Load cluster param plugin ok
Open ssh connection ok
Check before start ocp-server-ce ok
Start ocp-server-ce ok
[ERROR] failed to start 192.168.0.139 ocp-server-ce
See https://www.oceanbase.com/product/ob-deployer/error-codes .
Trace ID: 3ab6d416-0b7c-11f0-8e56-9016baea23f4
If you want to view detailed obd logs, please run: obd display-trace 3ab6d416-0b7c-11f0-8e56-9016baea23f4
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):
【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)
【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手 ] 即可召唤小助手,欢迎试用!
论坛小助手
2025 年3 月 28 日 10:57
#3
根据您提供的信息,OCP 在启动时遇到了问题。以下是可能的原因及解决方法:
1. 检查日志
2. 错误原因分析
根据文档中的信息,以下是一些可能导致 OCP 启动失败的常见原因及解决方法:
(1) OCP 启动用户不存在
如果 OCP 启动用户不存在,可能会导致启动失败。
解决方法:请参考《OCP 云平台》文档 用户规划 ,在 OCP 所在主机上创建启动用户。(依据:文档片段 1)
(2) 组件版本不匹配
(3) OCP Agent 状态异常
如果 OCP 中的主机状态为“离线”或“新提交”,可能会导致启动失败。
解决方法:
查询当前 OCP 管理主机的状态,详细操作可参见《OCP 云平台》文档 管理主机操作列表 。
如果主机状态为“离线”,可以尝试重装 OCP Agent,详细操作可参见《OCP 云平台》文档 重装 OCP Agent 。(依据:文档片段 6)
(4) 程序 Bug
如果 ocp_agentd 存在 Bug,可能会导致进程启动失败。
解决方法:请确保使用的是最新版本的 OCP 和 OB,并检查是否有相关的修复补丁。(依据:文档片段 8)
3. 重新部署
4. 联系技术支持
如果问题仍未解决,请参考日志信息获取失败原因,并联系 OceanBase 技术支持团队进行处理,或到官网 问答区 提问。(依据:文档片段 2)
总结
请按照上述步骤逐一排查问题。如果仍有疑问,建议提供更详细的日志信息以便进一步分析。
详情请参考:
错误码
通过图形化界面部署 OCP
使用图形化界面部署 OCP
obagent_dead Agent 服务不可用
OceanBase 安装部署工具 V2.8.0
使用图形化界面升级 OCP
辞霜
2025 年3 月 28 日 10:58
#4
OceanBase 社区已接收您的帖子,正在跟进中。
秃蛙
2025 年3 月 31 日 16:05
#6
问题已解决:
启动时日志未发现启动明确失败信息。
1)使用命令启动ocp-server 服务(obd日志中能查看到命令)
***** 更换 对应密码
export JDBC_PASSWORD=****** 更换为: ocp_meta 租户的密码
OCP_INITIAL_ADMIN_PASSWORD=****** 更换为: ocp白屏登录的密码
ocp.iam.encrypted-system-password=****** 更换为: oceanbase
–with-property=ocp.monitordb.password:****** 更换为: ocp_monotir 租户的密码
cd /disk_d/oceanbase/ocp/mhsb_ocp_nbk/admin/ocp; export JDBC_URL=jdbc:oceanbase://xx.xx.xx.xx:2891/meta_database; export JDBC_USERNAME=root@ocp_meta;export JDBC_PASSWORD=****** export JDBC_PUBLIC_KEY=;export OCP_INITIAL_ADMIN_PASSWORD=******;java -Dfile.encoding=UTF-8 -jar -Xms4g -Xmx4g -Docp.iam.encrypted-system-password=****** /disk_d/oceanbase/ocp/mhsb_ocp_nbk/admin/ocp/lib/ocp-server.jar --bootstrap --with-property=server.port:8096 --with-property=logging.file.max-size:100MB --with-property=ocp.logging.file.total.size.cap:1GB --with-property=ocp.monitordb.host:192.168.0.139 --with-property=ocp.monitordb.username:root@ocp_monitor --with-property=ocp.monitordb.port:2891 --with-property=ocp.monitordb.password:****** --with-property=ocp.monitordb.database:monitor_database --with-property=logging.file.name:/disk_d/oceanbase/ocp/mhsb_ocp_nbk/logs/ocp-server.log --with-property=ocp.site.url:[http://192.168.0.139:8080](http://192.168.0.139:8080/) --progress-log=/disk_d/oceanbase/ocp/mhsb_ocp_nbk/logs/bootstrap.log --with-property=obsdk.ob.connection.mode:direct --with-property=ocp.iam.login.client.max-attempts:60 --with-property=ocp.iam.login.client.lockout-minutes:1 --with-property=ocp.file.local.built-in.dir:/disk_d/oceanbase/ocp/mhsb_ocp_nbk/admin/ocp/ocp-server/lib --with-property=ocp.log.download.tmp.dir:/disk_d/oceanbase/ocp/mhsb_ocp_nbk/admin/ocp/logs/ocp --with-property=ocp.file.local.dir:/disk_d/oceanbase/ocp/mhsb_ocp_nbk/software
输出打印信息长时间处于initialize ocp datasource ,即 初始化ocp元数据库系统表。
3)查看ocp初始化日志 bootstrap.log,简单的 几条 insert 插入耗时2s。
4)磁盘性能 iostat -x 1,磁盘await延迟比较高,使用的机械盘
5)更换SSD磁盘后,1分钟完成初始化,启动ocp正常。