火山引擎云服务器事件类型汇总

axin 2025-04-02 42人围观 ,发现0个评论 火山引擎云服务器云服务器云服务器教程

👉点击这里申请火山引擎VIP帐号,立即体验火山引擎产品>>>


本文汇总了目前支持的事件类型、状态、名称及推荐操作等信息。

资源事件

由云资源在运行过程中触发的故障、运维、状态变化等事件。

计划内运维事件

事件类型
事件名称
事件
事件说明与影响
用户侧建议操作
SystemMaintenance.Redeploy
因系统维护实例重新部署
说明
仅本地SSD型、通用型、计算型、内存型、高主频型规格族的实例会触发本事件,详情可查看实例规格清单。
  • SystemMaintenance.Redeploy:Inquiring

  • SystemMaintenance.Redeploy:Executing

  • SystemMaintenance.Redeploy:Succeeded

  • SystemMaintenance.Redeploy:Failed

  • SystemMaintenance.Redeploy:Rejected

  • SystemMaintenance.Redeploy:Canceled

火山引擎检测到ECS实例所在的宿主机(物理机)、专有宿主机处于CPU过热、电源故障、风扇故障等亚健康状态,存在宕机风险。
需要您选择运维时间段,并授权在新宿主机中重新部署实例。操作详情可查看查询与响应“系统维护,实例重新部署”事件。
InfrastructureUpgrade.Redeploy
因基础设施升级实例重新部署
  • InfrastructureUpgrade.Redeploy:Inquiring

  • InfrastructureUpgrade.Redeploy:Executing

  • InfrastructureUpgrade.Redeploy:Succeeded

  • InfrastructureUpgrade.Redeploy:Failed

  • InfrastructureUpgrade.Redeploy:Canceled

  • InfrastructureUpgrade.Redeploy:Rejected

随着业务发展和云服务器宿主机(物理机)的健康状态变化,火山引擎将对部分老旧、性能不佳的基础设施进行升级和改造。
需要您选择运维时间段,并授权在新宿主机中重新部署实例。操作详情可查看查询与响应“基础设施升级,实例重新部署”事件。

非预期运维事件

事件类型
事件名称
事件
事件说明与影响
用户侧建议操作
SystemFailure.Redeploy
因系统故障实例重新部署
  • SystemFailure.Redeploy:Failed

  • SystemFailure.Redeploy:Succeeded

  • SystemFailure.Redeploy:Inquiring

  • SystemFailure.Redeploy:Executing

  • SystemFailure.Redeploy:Canceled

火山引擎检测到ECS实例宿主机(物理机)、专有宿主机出现故障导致宕机,需要将实例重新部署至新的宿主机恢复运行,否则实例及其中的业务将停止运行。
无需您操作处理。
说明
火山引擎默认将自动疏散该实例。您也可以自行调整自动运维方式,操作详情可查看查询与响应“系统故障,导致实例重新部署”事件。
SystemFailure.Reboot
因系统故障实例重启
说明
仅本地SSD型、大数据型、高性能计算GPU型规格族的实例会触发本事件,详情可查看实例规格清单。
  • SystemFailure.Reboot:Executing

  • SystemFailure.Reboot:Succeeded

  • SystemFailure.Reboot:Failed

火山引擎检测到ECS实例宿主机(物理机)出现故障导致宕机,将尝试通过重启恢复实例正常运行。
重启失败时,需要您授权重新部署实例。
说明
火山引擎默认将自动重启该实例,并在重启失败时自动重新部署实例。您也可以自行调整自动运维方式,操作详情可查看查询与响应“系统故障,导致实例重启”事件。
SystemFailure.Stop
因系统故障实例停止
  • SystemFailure.Stop:Executing

  • SystemFailure.Stop:Succeeded

  • SystemFailure.Stop:Failed

火山引擎检测到ECS实例宿主机(物理机)出现故障导致宕机,其上运行的实例也停止了运行。
无需您操作处理。
FileSystemReadOnly.Change
文件系统变为只读状态
  • FileSystemReadOnly.Change:Executing

  • FileSystemReadOnly.Change:Succeeded

火山引擎检测到ECS实例挂载磁盘的文件系统变为只读状态,此时磁盘只能读不能写,可能是由于磁盘硬件故障或系统文件被损坏。
无需您操作处理。
InstanceFailure
因操作系统错误实例异常
InstanceFailure:Succeeded
火山引擎检测到ECS实例运行时,操作系统内部出现内核panic、云盘IO Hang等异常情况。
建议您检查实例是否异常,若无异常,无需您操作处理;若存在异常,需要您自行重启实例尝试恢复实例正常运行。
说明
为了便于后续快速定位实例内核发生崩溃的原因,建议您开启操作系统的Kdump服务:
  • 在Linux操作系统中开启Kdump服务并定位内核崩溃原因

  • 在Windows操作系统中开启dump服务及并定位内核崩溃原因

GpuRiskDetected
GPU运行存在风险
说明
仅GPU计算型、高性能计算GPU型规格族的实例会触发本事件,详情可查看实例规格清单。
GpuRiskDetected.Succeeded
火山引擎检测到运行的GPU实例出现了故障,需要您重启实例尝试恢复实例正常运行。
需要您自行重启该实例。
DiskErrorDetected
硬盘异常
说明
仅大数据型、本地SSD型、使用本地盘的弹性裸金属型 、异构计算(GPU&HPC)规格族的实例会触发本事件,详情可查看实例规格清单。
  • DiskErrorDetected:Inquiring

  • DiskErrorDetected:Succeded

  • DiskErrorDetected:Canceled

火山引擎检测到本地盘实例的硬盘出现故障,无法正常进行读写操作,需要您授权将实例重新部署至新宿主机或更换新硬盘,否则实例将停止运行。
需要您授权重新部署实例或更换故障盘,详情可参考本地盘事件运维流程。
DiskError.Redeploy
因硬盘异常实例重新部署
说明
授权重新部署实例后将生成本事件。
  • DiskError.Redeploy:Inquiring

  • DiskError.Redeploy:Executing

  • DiskError.Redeploy:Succeeded

  • DiskError.Redeploy:Canceled

由于本地盘实例的硬盘出现软硬件故障,火山引擎正在将故障实例重新部署至新宿主机,恢复实例正常运行。
无需您操作处理。
DiskError.ReplaceDisk
因硬盘异常更换硬盘
说明
授权更换故障硬盘后将生成本事件。
  • DiskError.ReplaceDisk:Executing

  • DiskError.ReplaceDisk:Succeeded

  • DiskError.ReplaceDisk:Failed

  • DiskError.ReplaceDisk:Canceled

  • DiskError.ReplaceDisk:Pending

由于本地盘实例的硬盘出现软硬件故障,火山引擎正在将故障硬盘替换为新硬盘,恢复实例正常运行。
无需您操作处理。
InstanceOOM
实例内存OOM
InstanceOOM:Succeeded
火山引擎检测到ECS实例内存出现OOM问题。
无需您操作处理。
InstanceFileSystemFailure.StopAndRepair
因文件系统异常停机修复
说明
暂仅Windows操作系统支持因文件系统异常停机修复事件。
  • InstanceFileSystemFailure.StopAndRepair:Inquring

  • InstanceFileSystemFailure.StopAndRepair:Canceled

  • InstanceFileSystemFailure.StopAndRepair:Execting

  • InstanceFileSystemFailure.StopAndRepair:Failed

  • InstanceFileSystemFailure.StopAndRepair:Succeed

  • InstanceFileSystemFailure.StopAndRepair:Rejected

火山引擎检测到实例的系统盘受损导致文件系统异常,可能出现实例启动异常、无法连接等问题。
需要您选择运维时间段,并授权火山引擎进行关机修复操作,详情请参考授权关机修复。
说明
进入修复状态后,实例状态为维护中,且不支持启动实例、更换系统盘、初始化系统盘、变更规格。

费用预警事件

事件类型
事件名称
事件
事件说明与影响
用户侧建议操作
AccountUnbalanced.Stop
账户欠费,实例停止
  • AccountUnbalanced.Stop:Executing

  • AccountUnbalanced.Stop:Succeeded

按量计费实例,由于其归属账号欠费,将在1小时后停止。
建议您及时为账号充值续费。
AccountUnbalanced.Delete
账户欠费,实例释放
  • AccountUnbalanced.Delete:Executing

  • AccountUnbalanced.Delete:Succeeded

按量计费实例,由于其归属账号欠费,将在3小时后释放。
建议您及时为账号充值续费。

状态变化事件

事件类型
事件名称
事件
事件说明与影响
用户侧建议操作
CreateInstance
创建实例
  • CreateInstance:Executing

  • CreateInstance:Succeeded

  • CreateInstance:Failed

当创建ECS实例时,产生本系统事件。
无需您操作处理。
RunInstance
启动实例
  • RunInstance:Executing

  • RunInstance:Succeeded

  • RunInstance:Failed

当启动ECS实例时,产生本系统事件。
无需您操作处理。
StopInstance
停止实例
  • StopInstance:Executing

  • StopInstance:Succeeded

  • StopInstance:Failed

当停止ECS实例时,产生本系统事件。
无需您操作处理。
DeleteInstance
删除实例
  • DeleteInstance:Executing

  • DeleteInstance:Succeeded

  • DeleteInstance:Failed

当删除ECS实例时,产生本系统事件。
无需您操作处理。
SpotInstanceInterruption.Delete
抢占式实例中断,实例释放
  • SpotInstanceInterruption.Delete:Scheduled

  • SpotInstanceInterruption.Delete:Executing

  • SpotInstanceInterruption.Delete:Succeeded

抢占式实例因为库存不足或市场价高于出价而被强制回收前5分钟,将产生本系统事件。
无需您操作处理。
InstanceChargeType.Change
实例计费类型改变
  • InstanceChargeType.Change:Executing

  • InstanceChargeType.Change:Succeeded

  • InstanceChargeType.Change:Failed

当ECS实例计费类型改变时,产生本系统事件。
无需您操作处理。
InstanceConfiguration.Change
实例配置变更
  • InstanceConfiguration.Change:Executing

  • InstanceConfiguration.Change:Succeeded

  • InstanceConfiguration.Change:Failed

当ECS实例升/降配时,产生本系统事件。
无需您操作处理。
RebootInstance
重启实例
  • RebootInstance:Executing

  • RebootInstance:Succeeded

  • RebootInstance:Failed

当重启ECS实例时,产生本系统事件。
无需您操作处理。
DeploymentSet.Modify
修改实例部署集
  • DeploymentSet.Modify.Executing

  • DeploymentSet.Modify.Succeeded

  • DeploymentSet.Modify.Failed

当修改ECS实例的部署集时,产生本系统事件。
无需您操作处理。
ServerMigrationTask
服务器迁移任务
  • ServerMigrationTask.Executing

  • ServerMigrationTask.Pending

  • ServerMigrationTask.Recovered

  • ServerMigrationTask.Succeeded

  • ServerMigrationTask.Failed

当使用SMC开始源服务器迁移任务时,产生本系统事件。
无需您操作处理。
ServerMigration.FirstSync
服务器迁移,全量数据同步
  • ServerMigration.FirstSync.Succeeded

  • ServerMigration.FirstSync.Failed

当使用SMC全量迁移源服务器数据时,产生本系统事件。
无需您操作处理。
ServerMigration.AdditionalSync
服务器迁移,增量数据同步
  • ServerMigration.AdditionalSync.Succeeded

  • ServerMigration.AdditionalSync.Failed

当使用SMC增量迁移源服务器数据时,产生本系统事件。
无需您操作处理。

任务事件

由操作云资源的任务状态变化触发的事件。

任务状态类事件

事件类型
事件名称
事件
事件说明与影响
用户侧建议操作
ElasticScheduledInstance.Create
弹性预约单创建
  • ElasticScheduledInstance.Create:Failed

  • ElasticScheduledInstance.Create:Executing

  • ElasticScheduledInstance.Create:Succeeded

创建弹性预约单时,产生本系统事件。
无需您操作处理。
ElasticScheduledInstance.Cancel
弹性预约单取消
  • ElasticScheduledInstance.Cancel:Failed

  • ElasticScheduledInstance.Cancel:Executing

  • ElasticScheduledInstance.Cancel:Succeeded

取消弹性预约单时,产生本系统事件。
无需您操作处理。
ElasticScheduledInstance.Deliver
弹性预约单交付
  • ElasticScheduleInstance.Deliver:Scheduled

  • ElasticScheduleInstance.Deliver:Canceled

  • ElasticScheduledInstance.Deliver:Failed

  • ElasticScheduledInstance.Deliver:Executing

  • ElasticScheduledInstance.Deliver:Succeeded

  • ElasticScheduledInstance.Deliver:Pending

弹性预约单交付时,产生本系统事件。
无需您操作处理。
ElasticScheduledInstance.Invalid
弹性预约单失效
ElasticScheduledInstance.Invalid:Succeeded
弹性预约单失效时,产生本系统事件。
无需您操作处理


  • 火山引擎GPU云服务器使用指南-HPC配置NCCL
  • 标签列表
    请关注微信公众号
    微信二维码
    不容错过
    Powered By TOPYUN 云产品资讯