如何解决在CentOS 7.x的NVMe SSD本地直通盘实例中,使用FIO命令压测磁盘时报错问题?

axin 2025-04-19 3人围观 ,发现0个评论 火山引擎云服务器云服务器云服务器教程

👉点击这里申请火山引擎VIP帐号,立即体验火山引擎产品>>>

问题描述

在CentOS 7操作系统本地SSD型实例中执行fio命令压测本地盘时,出现NMI watchdog: BUG: soft lockup - xxx错误。

问题原因

由于CentOS 7.x操作系统kernel存在BUG,导致NVMe SSD本地直通盘的I/O中断都发送至某一CPU上,当该CPU的SI(software irq,软件中断)达到100时,将出现故障。

解决方案

在故障实例中执行如下命令。
rmmod nvme nvme_coremodprobe nvme use_threaded_interrupts=1
注意
本方案将新增irq进程,增加实例CPU的额外损耗,占用部分CPU。


请关注微信公众号
微信二维码
不容错过
Powered By TOPYUN 云产品资讯