206
云计算
负载均衡
产品简介
产品价格
快速入门
用户指南
实践操作
常见问题
购买指南
云服务器
产品简介
计费规则
购买指导
控制台使用指南
常见问题
云数据库
产品简介
计费规则
购买指导
快速入门
连接实例
控制台使用指南
对象存储
产品简介
控制台使用指南
程序员百科
Python
阿里云服务器ECS实例宕机并产生日志“RIP:__list_del_entry_valid.cold”怎么解决?

产品推荐:

1、安全稳定的云服务器租用,2核/2G/5M仅37元,点击抢购>>>

2、高防物理服务器20核/16G/50M/500G防御仅350元,点击抢购>>>

3、百度智能建站(五合一网站)仅880元/年,点击抢购>>> 模板建站(PC+手机站)仅480元/年,点击抢购>>>

4、阿里云服务器2核2G3M仅99元/年、2核4G5M仅199元/年,新老同享,点击抢购>>> 

5、腾讯云服务器2核2G4M仅99元/年、新老同享,点击抢购>>>   


点击这里点击这里进入阿里云ECS官方页面,立即免费体验云服务器ECS>>>

实例宕机并产生日志“RIP:__list_del_entry_valid.cold”

  • 问题描述

    Linux操作系统的ECS实例在运行过程中宕机,产生了“list_del corruption, ffff91bc2ad47048->prev is LIST_POISON2 (dead000000000200)”日志,调用栈类似如下:

     
    [1072741.548729] list_del corruption, ffff91bc2ad47048->prev is LIST_POISON2 (dead000000000200)
    [1072741.549507] ------------[ cut here ]------------
    [1072741.549886] kernel BUG at lib/list_debug.c:50!
    [1072741.550275] invalid opcode: 0000 [#1] SMP PTI
    [1072741.550646] CPU: 0 PID: 1583643 Comm: kworker/0:1 Tainted: G           OE    --------- -  - 4.18.0-305.3.1.el8.x86_64 #1
    [1072741.551468] Hardware name: Alibaba Cloud Alibaba Cloud ECS, BIOS 449e491 04/01/2014
    [1072741.552048] Workqueue: cgroup_destroy css_release_work_fn
    [1072741.552462] RIP: 0010:__list_del_entry_valid.cold.1+0x45/0x4c
    ...
    [1072741.560426] Call Trace:
    [1072741.560638]  css_release_work_fn+0x3f/0x240
    [1072741.560983]  process_one_work+0x1a7/0x360
    [1072741.561300]  worker_thread+0x30/0x390
    [1072741.561622]  ? create_worker+0x1a0/0x1a0
    [1072741.561933]  kthread+0x116/0x130
    [1072741.562195]  ? kthread_flush_work_fn+0x10/0x10
    [1072741.562557]  ret_from_fork+0x35/0x40
    [1072741.562843] Modules linked in: AliSecGuard(OE) nft_fib_inet nft_fib_ipv4 nft_fib_ipv6 nft_fib nft_reject_inet nf_reject_ipv4 nf_reject_ipv6 nft_reject nft_ct nf_tables_set nft_chain_nat nf_nat nf_conntrack nf_defrag_ipv6 nf_defrag_ipv4 ip_set nf_tables nfnetlink intel_rapl_msr intel_rapl_common isst_if_common nfit libnvdimm crct10dif_pclmul crc32_pclmul ghash_clmulni_intel rapl joydev pcspkr virtio_balloon i2c_piix4 ip_tables xfs libcrc32c ata_generic cirrus drm_kms_helper syscopyarea sysfillrect sysimgblt fb_sys_fops drm ata_piix libata crc32c_intel virtio_net net_failover serio_raw failover virtio_console virtio_blk
    [1072741.566968] Features: eBPF/event
    [1072741.567302] ---[ end trace 8f40bd2bf2a072e5 ]---
  • 问题原因

    操作系统内核版本Bug:list_del发生错误LIST_POISON2 (dead000000000200)引发的宕机。Bug详情

  • 解决方案

    将操作系统内核版本升级到kernel-4.18.0-305.12.1.el8_4或更高版本。具体操作,请参见升级Linux ECS实例内核。

    重要

    在操作前,建议您为ECS实例创建快照备份数据,避免因误操作造成的数据丢失。创建快照的具体操作,请参见创建一个云盘快照。


这条帮助是否解决了您的问题? 已解决 未解决

提交成功!非常感谢您的反馈,我们会继续努力做到更好! 很抱歉未能解决您的疑问。我们已收到您的反馈意见,同时会及时作出反馈处理!