安装OCP4.2.1失败,在ocp-server health check检查过不去!求解答!

【 使用环境 】测试环境
【 OB or 其他组件 】ocp-all-in-one-4.2.1-20231127205908.el7.x86_64.tar.gz
【 使用版本 】4.2.1
【问题描述】安装部署 ocp4.2.1 失败,提示:
ocp-server program health check
e[K[ERROR] failed to start 192.168.1.74 ocp-server
[ERROR] start ocp-server failed
[ERROR] ocp-server-ce start failed

【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——如何向 OceanBase 社区问答区报告错误

全部日志:
bootstrap.log (510.9 KB)

装了几次 总是ocp-server health check 检查没过去

cd ~/.obd/log/obd 日志幸苦也发下

目录下没有这个文件

找到了 已上传

obd 日志:

obd.txt (1.6 MB)

@piping

在日志中发现有报错,需要check

1 个赞

具体如何check? :melting_face:

看报错信息是 8680 端口被占用了,这个是启动 obd 白屏就报错了吗,还是启动 OCP 的时候报的错,obd 白屏的默认端口是8680, ocp 默认的应该是8080, 需要保证端口不能被占用

obd启动正常,启动ocp报错,start ocp-server ok 了 健康检查时出问题了:

Package oceanbase-ce-4.2.1.1-101010012023111012.el7 is available.
Package obproxy-ce-4.2.1.0-11.el7 is available.
Package ocp-server-ce-4.2.1-20231127205908.el7 is available.
install oceanbase-ce-4.2.1.1 for local ok
install obproxy-ce-4.2.1.0 for local ok
install ocp-server-ce-4.2.1 for local ok
±--------------------------------------------------------------------------------------------+
| Packages |
±--------------±--------±-----------------------±-----------------------------------------+
| Repository | Version | Release | Md5 |
±--------------±--------±-----------------------±-----------------------------------------+
| oceanbase-ce | 4.2.1.1 | 101010012023111012.el7 | e98c6ef860b5644c36f806e6fa2265255572b40a |
| obproxy-ce | 4.2.1.0 | 11.el7 | 0aed4b782120e4248b749f67be3d2cc82cdcb70d |
| ocp-server-ce | 4.2.1 | 20231127205908.el7 | 92177252c57cf643656c1c1d2073dc256c87e12a |
±--------------±--------±-----------------------±-----------------------------------------+
Repository integrity check ok
Parameter check ok
Generate ocp server configuration ok
Cluster status check ok
Initializes observer work home ok
Initializes obproxy work home ok
Initializes ocp-server work home ok
Remote oceanbase-ce-4.2.1.1-101010012023111012.el7-e98c6ef860b5644c36f806e6fa2265255572b40a repository install ok
Remote oceanbase-ce-4.2.1.1-101010012023111012.el7-e98c6ef860b5644c36f806e6fa2265255572b40a repository lib check !!
Remote obproxy-ce-4.2.1.0-11.el7-0aed4b782120e4248b749f67be3d2cc82cdcb70d repository install ok
Remote obproxy-ce-4.2.1.0-11.el7-0aed4b782120e4248b749f67be3d2cc82cdcb70d repository lib check ok
Remote ocp-server-ce-4.2.1-20231127205908.el7-92177252c57cf643656c1c1d2073dc256c87e12a repository install ok
Remote ocp-server-ce-4.2.1-20231127205908.el7-92177252c57cf643656c1c1d2073dc256c87e12a repository lib check ok
Try to get lib-repository
Package oceanbase-ce-libs-4.2.1.1-101010012023111012.el7 is available.
install oceanbase-ce-libs-4.2.1.1 for local ok
Remote oceanbase-ce-libs-4.2.1.1-101010012023111012.el7-411c69202b38e7e656ced7146b85c01414727149 repository install ok
Remote oceanbase-ce-4.2.1.1-101010012023111012.el7-e98c6ef860b5644c36f806e6fa2265255572b40a repository lib check ok
myoceanbase deployed
Search plugins ok
Load cluster param plugin ok
Check before start observer ok
[WARN] OBD-1012: (192.168.1.74) clog and data use the same disk (/home)

Start observer ok
observer program health check ok
Connect to observer ok
Initialize oceanbase-ce ok
Wait for observer init ok
±-----------------------------------------------+
| observer |
±-------------±--------±-----±------±-------+
| ip | version | port | zone | status |
±-------------±--------±-----±------±-------+
| 192.168.1.74 | 4.2.1.1 | 2881 | zone1 | ACTIVE |
±-------------±--------±-----±------±-------+
obclient -h192.168.1.74 -P2881 -uroot -p’Root123R’ -Doceanbase -A

succeed
Search plugins ok
Load cluster param plugin ok
Check before start obproxy ok
Start obproxy ok
obproxy program health check ok
Connect to obproxy ok
Initialize obproxy-ce ok
±-----------------------------------------------+
| obproxy |
±-------------±-----±----------------±-------+
| ip | port | prometheus_port | status |
±-------------±-----±----------------±-------+
| 192.168.1.74 | 2883 | 2884 | active |
±-------------±-----±----------------±-------+
obclient -h192.168.1.74 -P2883 -uroot -p’Root123R’ -Doceanbase -A
succeed
Search plugins ok
Load cluster param plugin ok
Check before start ocp-server ok
Create tenant ocp_meta ok
Create tenant ocp_monitor ok
Start ocp-server ok
ocp-server program health check
e[K[ERROR] failed to start 192.168.1.74 ocp-server
[ERROR] start ocp-server failed
[ERROR] ocp-server-ce start failed
Drop tenant ocp_meta ok
Drop tenant ocp_monitor ok

1 个赞

~/.obd/log/obd 这个日志里有详细信息


这个日志方便上传一下吗

该问题已单独对接,和OCP的jdbc驱动相关。

可以具体说说吗?如何解决?我也遇到这个问题了。是关于JDBC驱动解析的问题,在OCP-Server.jar启动的时候发生的,org.springframework.jdbc.CannotGetJdbcConnectionException: Failed to obtain JDBC Connection; nested exception is java.sql.SQLException: No suitable driver found for ${JDBC_URL}?useUnicode=true&characterEncoding=UTF8&connectTimeout=2000&socketTimeout=30000&rewriteBatchedStatements=true&zeroDateTimeBehavior=convertToNull

ocp-server.log (35.3 KB)

这个问题其实是机器硬件差,导致ocp初始化metadb元数据超时。默认是10分钟。
可以看ocp的初始化日志bootstrap.log 是否正常结束。结束标志:
2023-12-06T10:48:39.026] monitorDataSource END DEFAULT_DATA sqls:ob_wait_event
[2023-12-06T10:48:39.026] monitorDataSource END DEFAULT_DATA -
[2023-12-06T10:48:39.038] monitorDataSource END INSTALL -

如果是一样的问题,需要更换服务器或者提升服务器信息。暂时不支持修改初始化超时参数,正常2分钟以内会初始化完成。

bootstrap.log (14.3 KB)
这里面确实出现了Timeout,我需要增加机器的内存和磁盘对吧。如需增加,那最低要求的内存和磁盘是多少呢

看日志创建一张表耗时半分钟。如果是虚拟机,建议上物理机。
可以按16C 32G ,磁盘建议SSD。

bootstrap.log (10.4 KB)


我把资源调大些了(10C 22G内存 + 300G SSD磁盘),但这个disk is hung又是个啥问题

磁盘性能不足会导致读写占用大量IO,出现等待,超出data_storage_warning_tolerance_time,log_storage_warning_tolerance_time默认时间,会判定为磁盘故障。
可以做个dd测试验证下。或者看下/var/log/messages 看下是否有磁盘硬件故障问题。