木之星
#1
【 使用环境 】 测试环境
【 OB or 其他组件 】OB
【 使用版本 】4.1社区版
【问题描述】昨天新建了资源单元和资源池和租户,昨天不管是在服务器还是客户端都可以正常登录操作,昨天下午开始在该租户下用nohup在后台导入数据包,一切正常;今天早上发现该租户无法登录,系统租户还是能正常登录,集群也显示running
【复现路径】昨天通过2881切换为新租户,然后在服务器root账户下执行了nohup ./install_mysql.sh &,install_mysql.sh里面的是myloader 语句
【问题现象及影响】
【附件】
木之星
#3
今天上午用 obd cluster restart重启OB了,还是无法登录租户
渠磊
#4
install_mysql.sh 脚本内容方便透露下么,导入数据的进程是否还在
木之星
#5
重启集群后进程已经不存在了,脚本可以透漏,方便加个钉钉好友吗?
渠磊
#6
可以加我们社区版的钉钉支持群,看下是否方便复现。技术交流钉钉群(群号:33254054)
木之星
#7
已经加群了,能否告知下一般出现租户无法登录是由什么原因造成的?一般有哪些解决方案?
渠磊
#10
一般情况下当外部workload结束后会逐渐消化,当停了以后依旧存在积压,同时导致了租户无法登录这个问题相对比较严重的。
可以先用pstack(GitHub - peadar/pstack: Print stack traces from running processes, or core files. Works properly for x86_64 without frame pointers )抓下堆栈看下是阻塞在哪了,这个工具不可以在生产环境使用,切记
pstack $(pgrep observer) > /tmp/pstack.log