show master status 失去链接

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】
【 使用版本 】
【问题描述】清晰明确描述问题
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):
kk.txt (463.4 KB)

obproxy版本 :4.3.2.0-26

ob-ce版本:E 4.3.3.0

–sys租户
image

似乎一切正常。 中间进行操作, binlog_size还会变化

就是 show master status 在 2883端口 失去链接

附件日志里是用的 obcp 租户的连接,再跟您确认下您是连接到 obcp 租户执行 show master status 的吧?

另外麻烦看下 binlog 实例的运行目录里有没有报错日志。

  1. 运行错误日志 stderr 大小是 0

  2. obcp租户日志

同问

grep 一下 ERROR 和 EDIAG 看看

再次执行 show master status 后 什么都没有啊


那这看起来是 odp 连 obbinlog 的时候出问题了,我拉 odp 的同学看看。

obproxy 访问 binlog 实例端口 192.168.10.13:8100 探活失败了,可能是网络不通。试一下 obproxy 所在机器,能否直接 telnet 访问


你说的 8100端口是在 192.168.10.16 上面 ,这个机器上是 binlog服务

192.168.10.13 是 2883 2881 端口

日志里的报错

[2024-11-26 18:06:46.090812] WDIAG [PROXY.NET] handle_connect (ob_unix_net_processor.cpp:429) [23629][Y0-00007FAECFCE1550] [lt=0] [dc=0] detect socket error(optval=111, addr={192.168.10.13:8100}, ret=-4015)

obproxy 在连 192.168.10.13:8100,你的 binlog 应该是在 192.168.10.16 上吧, binlog_service_ip 是不是设置的不对。

您是在 16 和 13 都部署了 binlog server 吗?我看上面您那边执行 show binlog status 的时候,实例 ip 是 13。

你看错了 13是 obproxy

这里不是 192.168.10.13 吗?obbinlog 的 conf/conf.json 里 node_ip 写的是多少?跟所在机器 ip 一致吗?

image

image
这个地址 以前我写的是 192.168.10.13 后来改成 192.168.10.16 了 。 也重启了。

  1. 是否还有缓存? 怎么检查是否有缓存呢?

确认目前用的 conf/conf.json 里的 node_ip 没问题的话,可以把原来的 Binlog 任务删掉,重新创建一个任务。

Binlog Server 节点信息可以在元数据库的 nodes 表找到,心跳不正常的时候就会下线,你之前配错 ip 的那个节点在里面应该是下线状态了,可以放着不管。

是否提供 alter 命令进行修改呢?? 关键是运行一切正常,日志还能抓取到。

image

image
binlog_instances --8100端口
nodes —2983 端口

修改这两个表。 好了 。