集群重启,不是很稳定,经常性卡在Start ocp-express,有很大概率起不来,很是痛苦

1、社区v4.2.2版本。 1-1-1集群

2、集群启动经常性失败,多启动几次,有时候也能成功,看了很多帖子,比较典型的共性问题,但一直未能搞清楚根本原因。

大家是不是也经常性遇到?请官方老师帮分析一下。

1)如:failed to connect meta db

2)还有可能obagent启动失败

3)其它失败

给人的感觉是,集群不是很稳定,以后上生产环境,非常焦虑…

3、关于环境部署规划

1)32C、64G,3台虚机器。可分配ob使用在30G左右
白屏obd部署,机器的配置,某台

2)测试环境,数据盘、事物盘、软件盘公用,可用空间分别约100G
2)config
user:
username: ismartone
port: 22
oceanbase-ce:
version: 4.2.2.0
release: 100000192024011915.el7
package_hash: aa3053da7370a6685a2ef457cd202d50e5ab75d3
10.10.10.211:
zone: zone1
10.10.10.212:
zone: zone2
10.10.10.213:
zone: zone3
servers:

  • 10.10.10.211
  • 10.10.10.212
  • 10.10.10.213
    global:
    appname: myoceanbase
    mysql_port: 12881
    rpc_port: 12882
    home_path: /opt/TDS/myoceanbase/oceanbase
    obshell_port: ‘12886’
    datafile_size: 3GB
    datafile_maxsize: 0GB
    log_disk_size: 42GB
    memory_limit: 12GB
    ocp_meta_tenant_max_cpu: ‘1’
    ocp_meta_tenant_memory_size: 2G
    cluster_id: 1753943814
    root_password: iso-Root_AUS^2019
    enable_syslog_recycle: true
    enable_syslog_wf: false
    max_syslog_file_count: 4
    system_memory: 3G
    cpu_count: 30
    production_mode: false
    ocp_agent_monitor_password: 52H18EKqDd
    proxyro_password: oq03J4zM0G
    ocp_root_password: sNxJxUle1G
    ocp_meta_password: BS7jPMWill
    obproxy-ce:
    version: 4.2.1.0
    package_hash: 0aed4b782120e4248b749f67be3d2cc82cdcb70d
    release: 11.el7
    servers:
  • 10.10.10.211
  • 10.10.10.212
  • 10.10.10.213
    global:
    prometheus_listen_port: 12884
    listen_port: 12883
    home_path: /opt/TDS/myoceanbase/obproxy
    obproxy_sys_password: iso-Proxysys_AUS^2019
    skip_proxy_sys_private_check: true
    enable_strict_kernel_release: false
    enable_cluster_checkout: false
    rs_list: 10.10.10.211:12881;10.10.10.212:12881;10.10.10.213:12881
    observer_sys_password: oq03J4zM0G
    cluster_name: myoceanbase
    observer_root_password: iso-Root_AUS^2019
    depends:
  • oceanbase-ce
    obagent:
    version: 4.2.2
    package_hash: 19739a07a12eab736aff86ecf357b1ae660b554e
    release: 100000042024011120.el7
    servers:
  • 10.10.10.211
  • 10.10.10.212
  • 10.10.10.213
    global:
    monagent_http_port: 18088
    mgragent_http_port: 18089
    home_path: /opt/TDS/myoceanbase/obagent
    http_basic_auth_user: admin
    http_basic_auth_password: QXsLBRB5n2
    ob_monitor_status: active
    depends:
  • oceanbase-ce
    ocp-express:
    version: 4.2.2
    package_hash: 09ffcf156d1df9318a78af52656f499d2315e3f7
    release: 100000022024011120.el7
    servers:
  • 10.10.10.213
    global:
    port: 18180
    home_path: /opt/TDS/myoceanbase/ocpexpress
    java_bin: java
    logging_file_max_size: 100MB
    logging_file_total_size_cap: 1GB
    admin_passwd: qp.)89RL
    memory_size: 872M
    depends:
  • obagent
  • oceanbase-ce
  • obproxy-ce

3、相关日志

oblog.tar.gz (220.6 KB)

ocp-express组件已经不维护了,建议铲掉这个和obagent

资源是什么情况

官方已经不推荐使用ocp-express? 那使用标准ocp去安装集群?

是的

请问后续OCP会支持通过token方式进行免密登录吗(之前的obagent+prometheus方式是能做监控嵌入),我们自有数据库管理平台是嵌入了像MySQL的主要性能指标,某DB的监控和dashboard,面向众多业务产研&测试,都能自助查看,

token比较小众应该不会搞

可能先没描述清楚,比如1个dba对接100个业务研发,查询分析TOPSQL,慢SQL这些让研发自助去做(分享会话)比dba又单独找出来人工发过去效率、使用上肯定比不了,某DB也是鉴权方式获取授权码(分享会话)方式(这种方式行业内其它公司需要可能也多):

1、业务产研部门点击获取授权码

2、平台先通过账号密码鉴权模拟登录dashboard,获取授权码

3、业务产研部门用授权码方式登录dashboard