集群重启失败

切到236节点是正常的

有删过sys租户或者下线233这个节点的操作么

236节点sys@root用户执行
show parameters like ‘server_permanent_offline_time’;

select * from OCEANBASE.DBA_OB_TENANTS;

没有这个操作

show parameters like ‘server_permanent_offline_time’;

select * from OCEANBASE.DBA_OB_TENANTS;

官方是rpm包,有deb包吗?

https://www.oceanbase.com/docs/common-obdiag-cn-1000000002821472
官网有自行转换方法。可以参考。

麻烦到236节点执行下面sql,并且提供一份236正常节点的observer日志看一下。
select * from __all_server;

select * from __all_server;

236log.rar (5.3 MB)

我已经安装了obdiag ,obd obdiag下只有deploy和gather两个命令,没有analyze。
然后gather下面有ALL、clog、log、perf、slog等等,就是少了个scene。

obdiag命令可以到官方查询
https://www.oceanbase.com/docs/common-obdiag-cn-1000000002821583
当前233节点是否有ob进程

使用ps -ef | grep observer 是有一个observer的进程

主机侧判断该节点没有磁盘故障问题么?
麻烦重启一下233节点的ob服务,然后根据
cat observer.log*|grep "NOTICE"的时间 获取一下日志

再帮忙查一下三个节点的时钟是否一致

时钟一致
1746782528140

我在233执行 obd cluster start xx -c oceanbase-ce -s 10.140.18.233
说被锁住了,但我已经把233的observer进程给杀了。是不是其他节点进程在 集群不可以这样单独启动?

这个是你的obd在执行其他命令导致的

obd的命令,我查了一下进程没有包含obd的,是还有其他什么命令吗?

把233节点下掉重新加进去吧。233节点应该是无法自动拉起来了

可以发我看下文档吗,怎么下掉233节点

https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000002013120
参考官方文档

kill observer进程的时候 会损坏数据库文件,导致我现在启动不起来吗

不会