Kylin v10 离线安装,卡在Initialize oceanbase-ce不动了

【 使用环境 】测试环境
【 OB or 其他组件 】
【 使用版本 】4.3.2
【问题描述】根据单机部署数据库的文档,执行到obd cluster start obtest这步后,卡在Initialize oceanbase-ce不动了
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

3 个赞

QQ截图20240903174358

2 个赞

根据您的描述,您在离线安装 Kylin v10 并尝试启动 OceanBase 集群时遇到了问题,具体表现为执行 obd cluster start obtest 命令后卡在了 “Initialize oceanbase-ce” 这一步骤上。这可能涉及到 OceanBase 集群初始化过程中的某些问题。

由于 obdiag 主要用于诊断已经运行中的 OceanBase 集群的问题,对于集群初始化阶段的问题,obdiag 可能无法直接提供有效的日志采集或根因分析。但是,我们可以尝试通过收集一些基础信息来定位问题。

为了更好地帮助您解决问题,请提供以下信息:

  1. 您是否确认已经按照正确的步骤完成了 OceanBase 的离线安装?特别是 oceanbase-all-in-one 包的解压和环境变量的设置是否正确?
  2. 您能否提供执行 obd cluster start obtest 命令前后的完整终端输出日志?
  3. 您当前的操作系统版本是什么?是否有任何特殊的系统配置或安全策略可能影响到 OceanBase 的初始化?
  4. 是否有查看过 /home/admin/.obd/log/ 目录下的日志文件,特别是与 obtest 集群相关的日志,看看是否有更详细的错误提示?

虽然 obdiag 在这种情况下可能不是最直接的工具,但如果问题持续存在,您可以考虑在集群启动成功后使用 obdiag 来进一步检查集群的状态。在此之前,上述信息将有助于初步判断问题所在。

具体信息可参考以下文档:

附上敏捷诊断工具 obdiag 使用帮助链接

2 个赞

大概率是内存free内存太小,麻烦发下完整的obd日志 日志目录 /home/admin/.obd/log

2 个赞

2 个赞

再向您确认几个问题:

  1. 您是否已经尝试过删除已有的集群配置然后再重新启动
  2. 您当前使用的虚拟机资源分配是否满足 OceanBase 的最低要求
  3. 您是否确认已经按照官方文档正确配置了所有的系统参数
  4. 您在启动集群时遇到的具体错误信息是否与提供的日志完全一致
2 个赞

obd.txt (226.2 KB)
您好,帮忙看一下

2 个赞

你可以扩容4G内存再尝试下,我们同步分析下这个日志

2 个赞

您上传的日志文件显示了在尝试启动 obtest 集群时遇到的问题。根据日志中的错误信息,主要问题是集群已经被配置过,因此不能再次启动一个已经被配置过的集群。以下是日志的关键部分:

[ERROR] Deploy “obtest" is configured. You could not start an configured cluster.

这意味着 obtest 集群已经被配置过,不能再直接使用 obd cluster start obtest 命令来启动它。如果您希望重新启动或重新配置该集群,您需要先删除现有的集群配置。

解决方案

1. 删除现有集群配置

您可以使用 obd cluster destroy 命令来删除现有的集群配置。这将允许您重新创建和配置集群。

obd cluster destroy obtest

执行完上述命令后,您可以重新创建并启动集群。

2. 重新创建并启动集群

如果您已经删除了现有的集群配置,接下来您可以按照以下步骤重新创建并启动集群:

  1. 创建新的集群配置文件。
  2. 使用 obd cluster create 命令创建集群。
  3. 使用 obd cluster start 命令启动集群。

示例命令如下:

# 创建集群配置文件
cat > obtest.json <<EOF
{
  "cluster_id": "obtest",
  "servers": [
    {
      "ip": "127.0.0.1",
      "username": "root",
      "password": "your_password"
    }
  ],
  "sys_password": "your_password",
  "deploy_dir": "/path/to/deploy/dir",
  "log_dir": "/path/to/log/dir"
}
EOF

# 创建集群
obd cluster create -f obtest.json

# 启动集群
obd cluster start obtest

日志分析

根据您提供的日志文件,以下是一些关键信息:

  • 日志中提到集群已经被配置过,因此不能直接启动。
  • 日志还提供了错误码和跟踪ID,以便进一步诊断问题。

如果您仍然遇到问题,请确保您已经删除了现有的集群配置,并按照上述步骤重新创建和启动集群。如果问题依然存在,请提供更多详细信息以便进一步排查。

具体信息可参考以下文档:

(小助手的答复已结束,如未能解决您的问题,请继续提问并等待其他同学的回复,谢谢!)

2 个赞


现在配置是这个

1 个赞

可以看到的是可用内存不足 bootstarp 阶段失败了,具体原因需要看observer.log

1.麻烦发下observer.log
2.free -m 看下机器内存情况
3.使用obdiag进行部署前检查 obdiag check --cases=build_before
https://www.oceanbase.com/docs/common-obdiag-cn-1000000001102518

4.发下config.yaml文件,目录:/home/admin/.obd/cluster/部署名称/config.yaml

2 个赞

zzzzz
config.yaml.txt (2.9 KB)
没找到observer.log

1 个赞

observer.log 在这个目录下 /home/admin/oceanbase/log

1 个赞


是不是我安装的有问题 没有那个路径

1 个赞

你的环境在 /home/obosky/observer/log 下面

1 个赞

这个内存free是够的,重新部署试下呢

1 个赞


重新部署,报这个错,连接失败了

1 个赞

ssh obosky@127.0.0.1 试下
部署时不建议使用root用户,可以创建个普通用户,给sudo权限

好的,我在试一下

参考下部署前配置

https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000001052855

1 个赞