v4.2.0  arm 
问题: 部署成功未报错,obd start cluster 时 ocp-express报错 
Start ocp-express  
Start ocp-express ok 
[ERROR] failed to start server1(10.125.144.18) ocp-express 
[ERROR] ocp-express start failed 
Wait for observer init ok 
日志: 
ocp-express.log  (885.9 KB)
存在的问题: 
1、 ocp deploy时缺少校验,比如指定的网卡不对start时才报错 
2、 输出信息有误导。比如上面 start ocp 是成功的,接下来check 时报错 报start failed。 
3、 ocp启动较慢,如何再启动时不启动ocp 或者是报错后 如何单独启动
         
         
           
        
            
            
            
         
         
             
             
          
       
      
        
          
          
            秃蛙  
            
           
           
          
              
                2023 年8 月 29 日 11:03
               
               
          #3 
           
         
        
          问题1:部署阶段主要是下载和包安装过程,存在一些依赖,因此集中在start过程进行校验的。 
问题2:这块可能有问题,可以提供下安装时的配置文件,当前提供的日志需要结合配置文件确认一些问题; 
问题3:单独重启组件方式 obd cluster restart -c ocp-express
         
         
        
            
            
            
         
         
             
             
          
       
      
        
        
          ocp_meta_tenant: 
tenant_name: ocpdb 
max_cpu: 2 
memory_size: 2G 
log_disk_size: 7680M
。。。。。。 
ocp-express: 
depends:
oceanbase-ce 
obproxy-ce 
obagent 
servers: 
name: server1 
ip: 10.xxxxxx 
global: 
home_path: /data/oceanbase/ocp-server 
memory_size: 1G 
admin_passwd: xxxx 
logging_file_total_size_cap: 100GB 
 
         
         
        
            
            
            
         
         
             
             
          
       
      
        
          
          
            秃蛙  
            
           
           
          
              
                2023 年8 月 29 日 14:33
               
               
          #5 
           
         
        
          麻烦提供下obd日志  ~/.obd/log/obd
         
         
        
            
            
            
         
         
             
             
          
       
      
        
          
          
            秃蛙  
            
           
           
          
              
                2023 年8 月 29 日 15:31
               
               
          #8 
           
         
        
          obd的状态非实时同步的,我看日志 [2023-08-29 14:25:55.340] [e8d08916-4634-11ee-a6c4-fe1c6139190b] [INFO] Deploy “ob420” is stopped 已经是停止状态了。 
这个OB是你后台手动起的吗 ? ps -ef|grep obs
         
         
        
            
            
            
         
         
             
             
          
       
      
        
          
          
            秃蛙  
            
           
           
          
              
                2023 年8 月 29 日 15:58
               
               
          #10 
           
         
        
          ps -ef|grep obs 看下启动时间 
再obd重启下环境 
obd cluster restart 部署名称 
看下什么情况
         
         
        
            
            
            
         
         
             
             
          
       
      
        
        
          我destroy后重新部署了一次,现在看能看到第3个节点了 但是ocp-express还是原来的样子报错 起不来
         
         
        
            
            
            
         
         
             
             
          
       
      
        
          
          
            秃蛙  
            
           
           
             
          
              
                2023 年9 月 7 日 11:49
               
               
          #14 
           
         
        
          看express报错解析格式有问题 
org.springframework.beans.factory.BeanCreationException: Error creating bean with name ‘ocpExpressInitializer’: Invocation of init method failed; nested exception is java.lang.RuntimeException: Init by spring config files failed, please check config file format
obd配置debug信息解析节点IP是空值 
需要提供下你完整的obd部署配置文件(非粘贴),确认下配置格式是否正确。
         
         
        
            
            
            
         
         
             
             
          
       
      
        
          
          
            秃蛙  
            
           
           
          
              
                2023 年9 月 7 日 14:08
               
               
          #16 
           
         
        
          obd 黑屏部署和obd web 白屏部署方式,生成的配置文件在ocp-express模块的 yaml缩进格式表现不一致导致。 
可以先使用obd web方式部署,这个问题内部调整下、
         
         
        
            
            
            
         
         
             
             
          
       
      
        
          
          
            秃蛙  
            
           
           
          
              
                2023 年9 月 7 日 14:46
               
               
          #17 
           
         
        
          OB和OBagent的server的name 也需要保持一致。