oms部署失败0117

【 使用环境 】测试环境
【 OB or 其他组件 】
oms4.2.1
【 使用版本 】
oms4.2.1
【问题描述】清晰明确描述问题
1.通过部署脚本启动部署工具。执行命令
sh docker_remote_deploy.sh -o <OMS 容器挂载目录> -i <本机 IP 地址> -d <OMS_IMAGE>
报错
2.安装完成后,可以通过访问界面。点击机器菜单后报错,服务器内部异常。添加不了机器。
【附件及日志】

配置文件中不能使用localhost地址,改成实际IP重新部署看下。

“apsara_audit_enable”: “false”
“apsara_audit_sls_access_key”: “”
“apsara_audit_sls_access_secret”: “”
“apsara_audit_sls_endpoint”: “”
“apsara_audit_sls_ops_site_topic”: “”
“apsara_audit_sls_user_site_topic”: “”
“cm_is_default”: !!bool “true”
“cm_location”: “0”
“cm_nodes”:

  • “192.168.xx.xx”
    “cm_region”: “default”
    “cm_region_cn”: “默认地域”
    “cm_url”: “http://192.168.xx.xx:8088
    “drc_cm_db”: “hhitoms_cm”
    “drc_cm_heartbeat_db”: “hhitoms_cm_hb”
    “drc_rm_db”: “hhitoms_rm”
    “oms_meta_host”: “192.168.xx.xx”
    “oms_meta_password”: “密码”
    “oms_meta_port”: “2881”
    “oms_meta_user”: “用户”
    “tsdb_enabled”: “false”
    “tsdb_password”: “”
    “tsdb_service”: “”
    “tsdb_url”: “”
    “tsdb_username”: “”
    这是生成的配置文件,麻烦大佬看看,是不是oms必须要和数据库分开才可以,我是把oms和数据库放在一起部署的

是建议分开部署,oms占用资源比较大。
看报错是初始化阶段就失败了,你看下8090端口是否被占用。

是的初始化阶段就失败了,但是可以进页面


好像是容器里面已经在用8090端口了

我这报同样的错误,可能资源不足,等了几分钟 8090端口就启动了,然后有执行了 那个报错的挡墙命令。 就能进入页面了。


我这机器不报错,8090端口启动成功后,执行下 那个当前报错的命令
python -m omsflow.scripts.units.oms_cluster_manager add_resource

1 个赞

复现了下 显示localhost是正常的,初始化节点失败是不影响oms登录,会影响获取一些元数据信息,可以按楼上的方案,进入容器重新执行失败的第五步python命令。
同时建议oms和metadb分开部署。

1 个赞

oms部署可以使用mysql做为 元库, mysql节省资源很多,不要使用oceanbase。

谢谢大佬,有一个问题反馈一下,oms生成的配置文件有一个地方有错误。
微信图片_20240118142705
导致点击机器菜单后报错,服务器内部异常。添加不了机器

好滴,感谢老师的提醒。我反馈下。