ob 2.0 protocol header checksum error!

【 使用环境 】测试环境
【 OB 】OB
【 使用版本 】 4.2.10
【问题描述】单机OBSERVER OCP告警报非预期内部错误
【复现路径】无操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)
告警详情:[OBServer 非预期的内部错误] 集群:obce_xctest01,主机:...,日志类型:observer,日志文件:/home/admin/oceanbase/log/observer.log,日志级别:ERROR,关键字=Unexpected internal error happen,错误码=4388,日志详情=[2025-06-24 16:00:30.284432] ERROR issue_dba_error (ob_log.cpp:1875) [65699][sql_nio0][T0][Y0-0000000000000000-0-0] [lt=6][errcode=-4388] Unexpected internal error happen, please checkout the internal errcode(errcode=-4103, file=“ob_2_0_protocol_processor.cpp”, line_no=168, info=“ob 2.0 protocol header checksum error!”)。
这个错误是BUG吗
【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

根据用户问题描述,出现了“ob 2.0 protocol header checksum error!”错误,并且 OceanBase OCP 告警提示为“非预期的内部错误”,日志中出现错误码 -4103 和 -4388。这表明系统在处理 OB 2.0 协议时检测到协议头校验失败。

推荐使用 obdiag 工具进行日志采集,并将采集到的日志提供给我们以便进一步分析。

日志采集场景: 未能明确问题的场景
日志采集命令: obdiag gather scene run --scene=observer.unknown

此外,为了更深入地排查此类内部错误是否由网络、协议或底层数据损坏引起,建议您提供以下信息:

  1. 是否有频繁的客户端连接断开或异常重连现象?
  2. 是否近期有升级 OceanBase 版本或者修改过网络配置?
  3. observer.log 中是否有其他相关错误或警告信息(例如网络中断、协议不兼容等)?
  4. 当前使用的客户端驱动版本和类型(如 JDBC、ODBC 等)?
  5. 能否提供 obdiag 日志采集后的压缩包,用于进一步分析?

如果后续能确认是事务执行过程中报错,可再补充根因分析步骤。目前建议先收集未知问题场景下的日志信息。

附上敏捷诊断工具 obdiag 使用帮助链接

根据您的描述,这个问题可能是由多种因素引起的,例如网络问题、硬件故障或配置不当等。首先,我们可以通过使用 obdiag 工具来收集详细的日志信息,这将有助于我们更准确地定位问题。同时,由于这是一个具体的错误消息,我们也可以尝试进行根因分析。

日志采集场景: [未知问题]
日志采集命令: obdiag gather scene run --scene=observer.unknown

如果您能够提供具体的错误上下文或日志片段,可能会更容易找到问题的原因。在收集日志的同时,请您回答以下几个问题,以帮助我们更好地理解问题背景:

  1. 您的 OceanBase 集群当前的版本是什么?
  2. 是否最近进行了任何升级操作或配置更改?
  3. 这个告警是偶尔出现还是持续存在?
  4. 出现告警时,集群的负载情况如何?是否有大量并发请求?
  5. 您能否提供告警前后一段时间内的系统日志?
  6. 网络环境是否稳定,是否有丢包或延迟较高的情况?

收集到的日志和以上信息将对我们分析问题非常有帮助。请您执行上述日志采集命令并提供日志文件,我们将进一步分析可能的原因。

附上敏捷诊断工具 obdiag 使用帮助链接

看下这集群的详细版本

show variables like '%version_comment%';

发下OCP版本

[2025-06-24 16:00:30.284432 这个报错时间的observer.log压缩发下

是ARM平台的CPU吗