【 使用环境 】测试环境
【 OB or 其他组件 】OCP
【 使用版本 】4.3.4
【问题描述】ocp新建集群部署失败,observer崩溃
【复现路径】问题出现前后相关操作
【附件及日志】
集群的主机规格是多大的
目前用的华为欧拉操作系统 只部署了一个单节点 机器为16核、32g内存,数据盘100g
lscpu 看下cpu指令集
[root@localhost log]# lscpu
架构: x86_64
CPU 运行模式: 32-bit, 64-bit
Address sizes: 46 bits physical, 48 bits virtual
字节序: Little Endian
CPU: 16
在线 CPU 列表: 0-15
厂商 ID: GenuineIntel
BIOS Vendor ID: QEMU
型号名称: Intel(R) Xeon(R) CPU E7-4850 v4 @ 2.10GHz
BIOS Model name: pc-i440fx-2.12
CPU 系列: 15
型号: 6
每个核的线程数: 1
每个座的核数: 2
座: 8
步进: 3
BogoMIPS: 4189.90
标记: fpu de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx lm constant_tsc nopl xtopolo
gy cpuid tsc_known_freq pni cx16 x2apic hypervisor lahf_lm cpuid_fault pti
Virtualization features:
超管理器厂商: KVM
虚拟化类型: 完全
Caches (sum of all):
L1d: 512 KiB (16 instances)
L1i: 512 KiB (16 instances)
L2: 64 MiB (16 instances)
L3: 128 MiB (8 instances)
NUMA:
NUMA 节点: 1
NUMA 节点0 CPU: 0-15
Vulnerabilities:
Itlb multihit: KVM: Mitigation: VMX unsupported
L1tf: Mitigation; PTE Inversion
Mds: Vulnerable: Clear CPU buffers attempted, no microcode; SMT Host state unknown
Meltdown: Mitigation; PTI
Spec store bypass: Vulnerable
Spectre v1: Mitigation; usercopy/swapgs barriers and __user pointer sanitization
Spectre v2: Mitigation; Full generic retpoline, STIBP disabled, RSB filling
Srbds: Not affected
Tsx async abort: Not affected
原因:
当前使用的cpu不支持avx指令,OB内核用到了avx指令
解决方案:
更换支持AVX指令的CPU型号
obdiag也可以巡检出来
另外从OB4.3.5的下一个版本开始没有avx指令集的机器会直接不让启动了
也可参考这个帖子
好的 我刚把OB降级到4.2.1.10版本 部署成功了
应该是有问题的,你继续观察下 看是否可以正常使用