binlog Invalid argument

【 使用环境 】生产环境
【 OB or 其他组件 】ob binlog
【 使用版本 】ob 4.3.5.5 binlog 4.3.4
【问题描述】正常运行的binlog突然logproxy.log一直刷以下报错,白屏显示实例状态启动中且无法停止,在黑屏stop和drop实例后,白屏依旧显示实例且状态依旧启动中,最终删掉整个binlog集群重新部署配置恢复。

[2026-04-06 22:40:44.670234] [error] ob_mysql_packet.cpp(88): Failed to read packet length, errno: 22, error: Invalid argument
[2026-04-06 22:40:44.670237] [error] mysql_protocol.cpp(83): Failed to receive handshake packet from: ./run/pogme55wcv/binlog_instance.socket, error: 22(Invalid argument)
[2026-04-06 22:40:44.670241] [error] instance_client.cpp(62): Failed to login binlog instance, is_local: true, addr: ./run/pogme55wcv/binlog_instance.socket, exceed uds len limit: false
[2026-04-06 22:40:44.670243] [error] instance_client.cpp(42): Failed to connect to instance: pogme55wcv, server addr: ./run/pogme55wcv/binlog_instance.socket
[2026-04-06 22:40:44.670245] [error] database_protocol.cpp(3810): Failed to detect binlog instance: pogme55wcv
[2026-04-06 22:40:44.670252] [warning] database_protocol.cpp(3815): The local binlog instance [pogme55wcv] actually alive through kill 0 with pid [1632880]
[2026-04-06 22:40:45.692896] [info] database_protocol.cpp(4305): Begin to update instance gtid mapping data
[2026-04-06 22:40:45.711555] [info] mysql_protocol.cpp(70): Connect to server through unix domain socket success: ./run/pogme55wcv/binlog_instance.socket, user: OBM
[2026-04-06 22:40:45.711599] [warning] io.cpp(74): Failed to read, fd: 5, size: 4, error: 22(Invalid argument)
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

1 个赞

:+1: :+1:

看上去你那环境惹着bug了啊

蹲一手。。

:+1:

SHOW VARIABLES like ‘version_comment’;
是ocp部署的binlog么?ocp的版本信息能提供一下么?

log/logproxy.log run/${instance_name}/binlog_instance.log、libobcdc.log日志 提供一下

OceanBase_CE 4.3.5.5 (r105000012025111711-c10174c0486c38f64a2222486986bbe15d5da0dc) (Built Nov 17 2025 12:20:08)

OCP版本号: 4.4.0-20251114143405

Binlog版本号4.3.4-100000142025112018

是用ocp部署的binlog且正常运行了一段时间

日志重新部署覆盖了已经

在观察一下吧 如果有问题 建议还是把日志先保存以后 在处理 要不然没有日志办法查看问题