obproxy的诊断日志中出现大量如下报错,trace_type="PROXY_INTERNAL_TRACE",error_code:0, error_msg:"Connect error"

【 使用环境 】生产环境
【 OB or 其他组件 】obproxy
【 使用版本 】4.2.10
【问题描述】

[2026-05-14 10:33:07.201640] [4029][Y0-0000FFFBC9174580] [CONNECTION](trace_type=“PROXY_INTERNAL_TRACE”, connection_diagnosis={cs_id:573413, ss_id:0, proxy_session_id:0, server_session_id:0, client_addr:“172.22.11.16:19090”, server_addr:“Not IP address [0]:0”, cluster_name:"", tenant_name:"", user_name:"", error_code:0, error_msg:“Connect error”, request_cmd:“COM_SLEEP”, sql_cmd:“COM_HANDSHAKE”, req_total_time(us):9075}{user_sql:""})
[2026-05-14 10:34:07.208796] [4029][Y0-0000FFFBC9174580] [CONNECTION](trace_type=“PROXY_INTERNAL_TRACE”, connection_diagnosis={cs_id:572464, ss_id:0, proxy_session_id:0, server_session_id:0, client_addr:“172.22.11.16:30910”, server_addr:“Not IP address [0]:0”, cluster_name:"", tenant_name:"", user_name:"", error_code:0, error_msg:“Connect error”, request_cmd:“COM_SLEEP”, sql_cmd:“COM_HANDSHAKE”, req_total_time(us):716}{user_sql:""})
[2026-05-14 10:34:32.194460] [4029][Y0-0000FFFBC9174580] [CONNECTION](trace_type=“PROXY_INTERNAL_TRACE”, connection_diagnosis={cs_id:572496, ss_id:0, proxy_session_id:0, server_session_id:0, client_addr:“172.22.11.16:45858”, server_addr:“Not IP address [0]:0”, cluster_name:"", tenant_name:"", user_name:"", error_code:0, error_msg:“Connect error”, request_cmd:“COM_SLEEP”, sql_cmd:“COM_HANDSHAKE”, req_total_time(us):493}{user_sql:""})
[2026-05-14 10:35:14.763148] [4029][Y0-0000FFFC156A6C20] [CONNECTION](trace_type=“PROXY_INTERNAL_TRACE”, connection_diagnosis={cs_id:572554, ss_id:0, proxy_session_id:0, server_session_id:0, client_addr:“172.22.11.29:55399”, server_addr:“Not IP address [0]:0”, cluster_name:"", tenant_name:"", user_name:"", error_code:0, error_msg:“Connect error”, request_cmd:“COM_SLEEP”, sql_cmd:“COM_HANDSHAKE”, req_total_time(us):527}{user_sql:""})

这台服务器172.22.11.16 上部署了ocp 和 observer。看起来是 ODP 内部错误导致断连接的诊断信息

应用程序暂未发现异常。但是出现了大量的这样的错误。
error_code =0 这个错误号码在官网没有找到。
请问这是什么错误,影响如何?

6 个赞

支持支持

1 个赞

应该是未授权访问吧

能把整个日志 发一下 看看么?obproxy.log obproxy_diagnosis.log都发一下
从日志信息来看有客户端连上 OBProxy,在 Proxy 准备/发送握手包、尚未登录、也未连 OBServer 时连接就被断开,诊断是 Connect error(客户端侧连接异常)。

2 个赞

目标服务observer正常启动了没

1 个赞

都有正常启动

诊断日志有,当前的 obproxy.log 已经被覆盖了

obproxy.log这个日志 也提供一下

1 个赞

obproxy.log.zip (14.8 MB)
proxy.log 只有5月25日当天部分的

obproxy_diagnosis.log 里 大量的 Connect error 是前置负载均衡/监控的 TCP 探活(尤其 172.22.11.16 每几秒、172.22.163.29 每 3 分钟),在 OBProxy 握手阶段被记成断开;很多次业务登录全部成功,OBProxy 或集群是可用的,建议检查一下LB/F5等这样的负载均衡设备

obproxy_diagnosis.log.zip (5.5 MB)
抱歉,刚刚给的obproxy_diagnosis.log 和 obproxy.log 不是同一套环境的。

这个obproxy_diagnosis.log 和刚刚的obproxy.log 是匹配的,都是 172.22.96.157的 。

和刚刚那个环境相似的是 172.22.96.157 上也同时部署了 obproxy 和 observer。
172.22.96.157 ip 也是每几秒 造成一次 Connect error ,这个报错中客户端的ip 就是本机。

请问对于客户端 是 obproxy 本机的 connect error,也是同样的原因吗

学习

刚刚确认没有f5和lb,还可能是什么原因

学习一下,这个TroubleShooting看着不好搞呀,好难啊

报错应该是握手阶段、未登录、未连 OBServer、约 44ms 后断开的 Connect error
日志的时间不对等。目前该问题没有了么

这个报错持续出现,在obproxy_diagnosis.log 里

根据这个分析2026-05-25 13:28:19.513654] [4585][Y0-0000FFFEFF8E5510]
客户端在握手完成前发送 EOF,Proxy 未收到有效 MySQL 请求包,源端和目标端 都是 172.22.96.157,说明是 OBProxy 所在机器本机 发起的连接(本机进程/LB/探活/脚本),不是跨机业务 SQL。未连 OBServer应该是个探活/错误客户端/非完整 MySQL 协议,不是 Observer 故障

支持