【 使用环境 】 测试环境
【 OB or 其他组件 】OB
【 使用版本 】
【问题描述】清晰明确描述问题
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):
【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)
告警概述:alarm_template_id=0:ob_cluster=myocp-1763194788:host=192.168.2.194 OBServer 非预期的内部错误
告警详情:[OBServer 非预期的内部错误] 集群:myocp,主机:192.168.2.194,日志类型:observer,
日志文件:/root/oceanbase/log/observer.log,
日志级别:ERROR,关键字=Unexpected internal error happen,错误码=4388,
日志详情=[2025-11-16 12:43:20.628071] ERROR issue_dba_error (ob_log.cpp:1875)
[2890330][T1002_L0_G0][T1002][YB42C0A802C2-0006439E04667B70-0-0] [lt=48]
[errcode=-4388] Unexpected internal error happen, please checkout the internal errcode
(errcode=-4009, file=“ob_tx_data_functor.cpp”, line_no=391, info=“unexpected io error”)。
系统提示我无法上传文件,所以我无法上传 /root/oceanbase/log/observer.log
【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!
1 个赞
论坛小助手
#3
用户问题: OBServer 在测试环境中出现非预期的内部错误,错误码为 -4388,具体错误信息为 unexpected io error,如何排查和解决这个问题?
针对您的问题,我们推荐使用 obdiag 工具进行日志采集,以便进一步分析问题。请使用以下命令来采集相关的日志信息:
日志采集场景: io问题
日志采集命令: obdiag gather scene run --scene=observer.io
请执行上述命令并收集日志,然后将生成的日志文件提供给我们,我们将基于这些信息进行进一步的分析。
另外,为了能够更准确地定位问题,请您提供以下信息:
- 出现错误的时间点及持续时间。
- 系统当前的 IO 负载情况,是否在错误发生前有异常增加。
- 当前存储设备的状态,例如是否有告警或错误提示。
- 是否有近期对存储设备或其配置进行了任何更改。
- 错误发生时,是否有大量读写操作正在进行。
- 系统的硬件配置详情,包括存储设备的型号和规格。
附上敏捷诊断工具 obdiag 使用帮助链接
1 个赞
辞霜
#4
这边修改了一下你的用户等级可以上传日志了,推荐使用小助手描述的obdiag分析io问题先收集一下信息
/root/oceanbase/log/observer.log
observer.7z (5.9 MB)
1 个赞
辞霜
#8
zone_1 _2 _3应该是你后扩容的,需要把ocp_meta和ocp_monitor租户都添加副本到这三个节点中。不过这仨节点内存应该是不够的。

1 个赞
辞霜
#9
扩容目的是什么呢。如果是测试ocp集群单机即可。这仨节点可以另部署一台高可用集群
1 个赞
谢谢您的回复,我是一个初学者,正在虚拟机测试OCP和高可用集群,这3个节点每台虚拟机是16GB内存的, 后面加入的集群。你可以把具体操作的文档地址发给我吗?我原来是SQL SERVER的DBA,准备研究下OCEANBASE数据库,往这方面发展,冒昧问下,有没有适合OCEANBASE的钉钉群?我想加下
1 个赞
辞霜
#11
社区的交流群33254054。
ocp的meta集群应该是禁止删除节点的。可能使用铲掉集群重新部署了
meta集群存在很多限制,建议后续该集群部署后保持即可,所有测试在其他集群进行即可