👉点击这里申请火山引擎VIP帐号,立即体验火山引擎产品>>>
问题描述
在CentOS 7操作系统本地SSD型实例中执行fio命令压测本地盘时,出现NMI watchdog: BUG: soft lockup - xxx错误。
问题原因
由于CentOS 7.x操作系统kernel存在BUG,导致NVMe SSD本地直通盘的I/O中断都发送至某一CPU上,当该CPU的SI(software irq,软件中断)达到100时,将出现故障。
解决方案
在故障实例中执行如下命令。
rmmod nvme nvme_coremodprobe nvme use_threaded_interrupts=1
注意
本方案将新增irq进程,增加实例CPU的额外损耗,占用部分CPU。