👉点击这里申请火山引擎VIP帐号,立即体验火山引擎产品>>>
本文主要介绍如何排查和解决RDMA网络配置器未正常运行的问题。
操作步骤
登录目标实例,操作详情可参考登录Linux实例。
请执行如下命令,确认rdma-agent.service服务状态是否为active (exited)。
systemctl status rdma-agent.service
正常运行示例如下
若不是active (exited)状态,请进行如下操作:
仅高性能计算GPU型实例支持RDMA,关于高性能计算GPU型。
若实例不支持RDMA网络,rdma-agent.service服务状态异常或不存在,视为正常情况。
请确认您的实例是否支持RDMA网络,只有实例支持RDMA网络时,才需要使用rdma-agent.service服务。
说明
若您的实例支持RDMA网络,请执行如下命令重启服务。
systemctl restart rdma-agent.service
重启服务后,再次执行如下命令查看服务状态是否为active (exited)。
systemctl status rdma-agent.service
若还未解决您的问题,请提交工单获取技术支持。