OBServer 非预期的内部错误errcode=-4388

【 使用环境 】 测试环境
【 OB or 其他组件 】OB
【 使用版本 】
【问题描述】清晰明确描述问题
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)
告警概述:alarm_template_id=0:ob_cluster=myocp-1763194788:host=192.168.2.194 OBServer 非预期的内部错误

告警详情:[OBServer 非预期的内部错误] 集群:myocp,主机:192.168.2.194,日志类型:observer,
日志文件:/root/oceanbase/log/observer.log,
日志级别:ERROR,关键字=Unexpected internal error happen,错误码=4388,
日志详情=[2025-11-16 12:43:20.628071] ERROR issue_dba_error (ob_log.cpp:1875)
[2890330][T1002_L0_G0][T1002][YB42C0A802C2-0006439E04667B70-0-0] [lt=48]
[errcode=-4388] Unexpected internal error happen, please checkout the internal errcode
(errcode=-4009, file=“ob_tx_data_functor.cpp”, line_no=391, info=“unexpected io error”)。

系统提示我无法上传文件,所以我无法上传 /root/oceanbase/log/observer.log

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

1 个赞

用户问题: OBServer 在测试环境中出现非预期的内部错误,错误码为 -4388,具体错误信息为 unexpected io error,如何排查和解决这个问题?

针对您的问题,我们推荐使用 obdiag 工具进行日志采集,以便进一步分析问题。请使用以下命令来采集相关的日志信息:

日志采集场景: io问题
日志采集命令: obdiag gather scene run --scene=observer.io

请执行上述命令并收集日志,然后将生成的日志文件提供给我们,我们将基于这些信息进行进一步的分析。

另外,为了能够更准确地定位问题,请您提供以下信息:

  1. 出现错误的时间点及持续时间。
  2. 系统当前的 IO 负载情况,是否在错误发生前有异常增加。
  3. 当前存储设备的状态,例如是否有告警或错误提示。
  4. 是否有近期对存储设备或其配置进行了任何更改。
  5. 错误发生时,是否有大量读写操作正在进行。
  6. 系统的硬件配置详情,包括存储设备的型号和规格。

附上敏捷诊断工具 obdiag 使用帮助链接

1 个赞

这边修改了一下你的用户等级可以上传日志了,推荐使用小助手描述的obdiag分析io问题先收集一下信息

sysstat_192.168.2.200_20251117110221.tar.gz (19.6 KB)
sysstat_192.168.2.199_20251117110217.tar.gz (19.7 KB)
sysstat_192.168.2.198_20251117110214.tar.gz (19.7 KB)
sql_result.txt (31.2 KB)
sysstat_192.168.2.194_20251117110212.tar.gz (20.1 KB)

1 个赞

result_summary.txt (4.6 KB)
shell_result.txt (2.9 KB)

1 个赞

/root/oceanbase/log/observer.log
observer.7z (5.9 MB)

1 个赞

zone_1 _2 _3应该是你后扩容的,需要把ocp_meta和ocp_monitor租户都添加副本到这三个节点中。不过这仨节点内存应该是不够的。
image

1 个赞

扩容目的是什么呢。如果是测试ocp集群单机即可。这仨节点可以另部署一台高可用集群

1 个赞

谢谢您的回复,我是一个初学者,正在虚拟机测试OCP和高可用集群,这3个节点每台虚拟机是16GB内存的, 后面加入的集群。你可以把具体操作的文档地址发给我吗?我原来是SQL SERVER的DBA,准备研究下OCEANBASE数据库,往这方面发展,冒昧问下,有没有适合OCEANBASE的钉钉群?我想加下

1 个赞

社区的交流群33254054。
ocp的meta集群应该是禁止删除节点的。可能使用铲掉集群重新部署了
meta集群存在很多限制,建议后续该集群部署后保持即可,所有测试在其他集群进行即可

好的,确实禁止删除。。。