火山引擎云服务器运维指南-RDMA网络配置器未正常运行解决方案

axin 2025-04-02 8人围观 ,发现0个评论 火山引擎云服务器云服务器云服务器教程

👉点击这里申请火山引擎VIP帐号,立即体验火山引擎产品>>>

本文主要介绍如何排查和解决RDMA网络配置器未正常运行的问题。

操作步骤

  1. 登录目标实例,操作详情可参考登录Linux实例。

  2. 请执行如下命令,确认rdma-agent.service服务状态是否为active (exited)。

    systemctl status rdma-agent.service

    正常运行示例如下

    alt

  3. 若不是active (exited)状态,请进行如下操作:

    • 仅高性能计算GPU型实例支持RDMA,关于高性能计算GPU型。

    • 若实例不支持RDMA网络,rdma-agent.service服务状态异常或不存在,视为正常情况。

    1. 请确认您的实例是否支持RDMA网络,只有实例支持RDMA网络时,才需要使用rdma-agent.service服务。

      说明

    2. 若您的实例支持RDMA网络,请执行如下命令重启服务。

      systemctl restart rdma-agent.service
    3. 重启服务后,再次执行如下命令查看服务状态是否为active (exited)。

      systemctl status rdma-agent.service
    4. 若还未解决您的问题,请提交工单获取技术支持。


请关注微信公众号
微信二维码
不容错过
Powered By TOPYUN 云产品资讯