【 使用环境 】生产环境
【 OB or 其他组件 】 OBServer
【 使用版本 】OBServer: 4.3.1.0 OBProxy:4.2.1.0-11
【问题描述】
我的OceanBase群集是3个Zone,把租户在3个Zone里的内存、cpu资源配置为不同的方式(如Zone1:25G 、10CPU,Zone2:23G、8cpu,Zone3:20G、6CPU(只读))这样,目前发现一个问题是服务器经常死机咯,不知道有没有影响
可以这么分,zone的优先级是zone1;zone2;zone3?死机现象是服务挂了还是服务器挂了?有日志吗?
ssd盘吗?装下iostat命令吧
这盘有点差,hdd盘,如果是云服务器的话,更换成高性能io的ssd试试看吗
配置是可以的,估计死机同硬件资源有关系吧
目前找不到问题原因,最近每天都要重启(已连续3天),要不就数据库访问不了,,云平台上说查物理组件方面也没发现什么问题,,刚好是我调整了数据库Zone的资源分配后就出现的,OCP平台又蹦了(主要是meta数据库起不了),没法管理到了
1、数据库访问不了是服务器特别卡么?ocp有检测到主机的资源信息?
2、ocp的meta数据起不来了?这个ob集群是ocp的元数据库么?目前我看数据库的进程是在运行的呀
是OCP的meta数据库起不来了,我在另一个贴上有提这个处理的,但是修复不了咯,,,好在我业务数据库是分开的,要不惨了
那这个帖子 只是ob集群有问题是么?不是ocp的元数据库是吧 如果另一个ocp的meta数据库 有问题 无法修复了 就重新搭建 在接管这个集群
嗯,就是OCP的元数据库集群起不来了的,,我现在就是想重新安装一套OCP,我想问问我一台机16cpu、64G内容可以部署observer、ocp这些服务么,性能可以管理得了12台业务的OBserver吗?
你这个集群 就是ocp的元数据是吧 其他的observer节点有问题么?
业务OBServer是正常的,,现在有一个问题我重新安装OCP了(新装元数据库的),在添加主机管理时添加不了(还没退出坏的OCP管理),提示错误:
错误码
COM10999
错误信息
发生一个未知的错误,错误原因:Execute clock diff failed.,错误信息:172.16.1.54,请联系管理员
这个我看过服务器的时间是差异不大的,装的是同一时钟同步服务,服务器指向同一主机的,,
我已跳过时钟检测添加回主机了,目前是不知道怎接管得回原来的OBserver业务集群了
尽量是毫秒级 要不然时钟会有问题