oceanbase启动异常

【 使用环境 】生产环境
【 OB or 其他组件 】
【 使用版本 】4.1.0
【问题描述】数据库重启失败 提示failed to connect meta db ocp-express start failed observer need bootstarp,重新更改配置文件 无法reload
【复现路径】问题出现前后相关操作
【附件及日志】


【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

3 个赞

日志采集场景: 集群无法连接
日志采集命令: obdiag gather scene run --scene=observer.cluster_down

推荐使用 obdiag 工具进行日志采集,并且将采集到的日志提供给我们以便确认问题所在。上述命令将会收集与集群无法连接相关的诊断信息,有助于我们分析启动失败的具体原因。

另外,为了确定具体的问题,在此需要您提供一些信息:

  1. 更改了配置文件中的哪些参数?
  2. 是否有对 OceanBase 进行过升级或打补丁操作?
  3. 在更改配置文件之前,集群是否能够正常工作?
  4. 除了 ‘failed to connect meta db ocp-express start failed observer need bootstarp’ 错误信息外,还有没有其他报错信息?
  5. 当前使用的 OCP 或 OBD 版本是多少?(如果适用)

通过这些信息,我们可以更好地帮助您定位和解决问题。请执行上述命令并将日志压缩包提供给我们。

附上敏捷诊断工具 obdiag 使用帮助链接

2 个赞

log_disk_size当前修改为多少了,推荐设置为内存的3-4倍大小。
执行reload报错是什么贴一下看看。可以先使用带参启动的方式 .bin/observer -o ‘log_disk_size=300G’

2 个赞

设置成100G了 方便远程看一下吗

2 个赞

方便贴一下报错么
你可以提个官方悬赏帖

2 个赞

image
现在是这样了 感觉好像配置文件没有生效
之前是

正常启动是什么样子呢 你之前不是说reload报错目前解决了么
提供一份obd日志看一下

1 个赞

reload就是

log.txt (21.6 KB)

1.刚才使用–wop启动最后是ocp-express启动失败,observer已经启动成功,麻烦发一份obd的详细日志和 ocp-server日志: /home/admin/ocp/log中,ocp-server.log
2.把参数修改回去,使用obd cluster start 启动,提供一下obd报错日志
3.使用带参启动方式.bin/observer -o ‘log_disk_size=300G’尝试拉起observer,然后使用obd修改参数log_disk_size为带参启动的大小。如遇到错误麻烦贴一下报错截图

1 个赞

bootstrap.log (20.7 KB)
ocp-express.log (670.5 KB)

1.bin/observer -o ‘log_disk_size=300G’这个命令在哪里 我没有找到这个命令 2.把参数修改回去,使用obd cluster start 启动 这个我启动就会提示让我用-wp的启动 然后继续init 3。 /home/admin/ocp/log中,ocp-server.log 这个路径没有找到

或者这个数据库文件我是否能备份出来 我重新安装数据库 把数据库文件再放进去呢

bin目录在你安装ob的home目录中,没有备份的话不可以使用数据库文件恢复

1 个赞

那有哪些日志文件是可以删除的呢

clog文件不允许删除 当前还是先将ob使用带参启动方式拉起来吧

1 个赞

ob使用带参启动方式拉起
observer.log (36.9 MB)
报错日志

你带参启动log_disk_size设置的多大,是否有操作删除过日志盘文件

设置的325G 没删除过任何文件

日志中显示带上参数启动ob后检测clog太小无法读取文件直接退出了,检查下存放log盘的实际磁盘有325G么。
前往与bin目前同级下的etc目录 strings observer.config.bin 看一下相关参数截图发一下

我把服务器回退了 现在有个新的问题就是 oceanbase缓存了2TB的磁盘空间 系统空间存日志 什么的了 起不来应用了
image