启动ob集群失败 obd cluster start obtest --wop

又开始增大了一点

按照刚才发的获取下信息,今晚先别继续跑了,也有可能是触发啥bug了

查找日志:Too many sstables in tablet, cannot schdule mini compaction, retry later,若存在对应日志则代码转储存在问题
执行sql看一下结果
select * from oceanbase.__all_virtual_log_stat where tenant_id = {0} and end_lsn-base_lsn >128 * 1024 * 1024 and svr_ip=’{1}’ and svr_port={2} ;

日志是在observer.log文件中找吗?
sql中三个参数从哪来?

我已经停止插数据了,为啥一直不回收clog呢?

sys的tenant_id=1. ip为ob服务的ip port如果未修改试试2881或2882。(你可以自己查一下该表的数据对比下看看)
日志是在observer.log文件中的

日志中没搜到这几个关键字相关
sql查出来有3条数据

三条数据对应3个节点,看起来没啥问题。

248节点同步有问题。到248节点根据关键字can_skip_base grep一下日志
可以尝试grep ‘update min using’ observer.log

老师,我这几天暂时登录不了ob集群的服务器了,这个日志过几天我再查下;
另外正好问下另一个问题,像这种obd启动的集群,如何做数据备份呢?以期在ob集群挂掉之后新建集群能快速恢复数据;
看了几个文档,感觉说得都不是很清楚,而且很多操作不支持4.0以上的版本,我目前用的是4.2.5的。

用别人的账户登录248机器查了下几个observer.log,在日志中没有搜到这些关键字

可以进行配置备份任务,或者搭建个备租户

有相关文档链接吗?想看下ob集群挂掉后具体怎么操作才能恢复数据。

https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000002013558

感觉这种不太符合真实场景,我们希望在ob集群登录不上之后,destroy掉原本的集群再新搭建一个集群,在新的集群上可以恢复数据,而不是在之前的集群还可以登录的情况下恢复数据。

https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000002588069
数据备份也可以。不过数据恢复存在时间问题。
实时同步的主备租户,是可以当主租户故障时候进行failover切换备租户为主租户提供服务

老师,感觉还是不太符合啊,我的意思是现有的ob集群挂掉,登不上数据库的情况下,要重新搭建一个ob集群,在新的ob集群中怎么恢复数据。


看文档中的描述,都是登上数据库后在现有的数据库上操作。


参考这里的数据备份

好吧,我换一种问法,obd如何导出某个租户下所有库中所有表的表结构以及表中的数据?

使用obdumper工具,不过该工具是要去ob在线情况下。
你说的这种登不上数据库的情况下,要重新搭建一个ob集群进行恢复,是需要开启数据备份的。
建议使用ocp进行配置比较方便