【 使用环境 】生产环境
【 OB or 其他组件 】OceanBase云平台 Express
【 使用版本 】v 4.2.2.1
【问题描述】Unhandled exception, type=HttpRequestFailedException, message=[AgentClient]:http request is failed, response:AgentResponse(successful=false, timestamp=2024-08-07T16:46:10.311715148+08:00, duration=0, status=Internal Server Error, traceId=4295aa2803e74cdc, server=172.16.10.120, data=null, error=code=1002,message=Unexpected error: Module=api/client, kind=INTERNAL, code=api_request_failed; [/api/v1/status] cause: Post “http://socket/api/v1/status”: dial unix /root/data_bak/obagent/run/ob_agentd.29549.sock: connect: connection refused,subErrors=,)
【附件及日志】
看一下agent进程是否还存在,手动拉起下试试
使用 obd 部署的一整套单机,如何拉起?点【重启Agent】报同样错误
[root@localhost ocp_agent]# ps -ef | grep obagent
root 13458 29915 0 16:55 pts/0 00:00:00 grep --color=auto obagent
root 29555 1 0 8月06 ? 00:15:12 /root/data_bak/obagent/bin/ob_monagent
root 29556 1 0 8月06 ? 00:00:04 /root/data_bak/obagent/bin/ob_mgragent
可以使用 obdiag
工具进行日志采集,并且将采集到的日志提供给我们以便确认问题所在。
日志采集场景: 服务器连接建立失败
日志采集命令: obdiag gather run --scene=observer.server_connection_failure
obd cluster restart 集群名 -c obagent
重启agent试试
重启 ob_mgragent 会影响正在进行的 OMS 数据迁移吗?
不影响
obd display-trace 看一下命令执行细节
提示的端口冲突,我等 OMS 迁移完再试试吧。谢谢你。
oms也建在这个节点上么
OMS不在,再另一台机器
OceanBase云平台 Express 和 OBserver 在一台机器