👉点击这里申请火山引擎VIP帐号,立即体验火山引擎产品>>>

背景信息

GPU云服务器正常工作需提前安装正确的基础设施软件,对NVIDIA Tesla系列的GPU而言,有以下两个层次的软件包需要安装:
  • 驱动GPU工作的硬件驱动程序。

  • 上层应用程序所需要的库。

在通用计算场景下,如深度学习、AI等通用计算业务场景或者OpenGL、Direct3D、云游戏等图形加速场景,安装了Tesla驱动的GPU才可以发挥高性能计算能力,或提供更流畅的图形显示效果。

操作场景

如果您在创建GPU实例时未同时安装Tesla驱动,则需要在创建GPU实例后,参考本文和安装CUDA工具包手动安装Tesla驱动。
说明
  • 手动安装GPU驱动和CUDA包时,必须确保驱动版本和CUDA包版本的兼容性,了解更多。

  • 为方便使用,您可以在创建GPU实例时,选择支持自动安装或者预装了特定版本GPU驱动和CUDA的公共镜像,了解更多。

  • 搭载A100/A800显卡的实例还需安装NVIDIA-Fabric Manager服务,否则将无法正常使用GPU实例。

前提条件

您已购买GPU实例,并为其绑定公网IP,使其具备访问公网的能力。

安装GPU驱动(Linux)

Linux操作系统的驱动安装采用Shell脚本安装方式,适用于任何Linux发行版,包括CentOS、Ubuntu等。
  1. 访问NVIDIA 驱动下载。

  1. 设置搜索条件,单击“查找”按钮查找符合条件的驱动版本。本文以Tesla T4安装CUDA 12.2对应的GPU驱动版本为例,如下图所示。

alt

配置项
说明
示例
  • 产品类型

  • 产品系列

  • 产品家族

根据实例规格配备的GPU卡进行选择。详情请参见实例规格介绍。
  • Data Center / Tesla

  • T-Series

  • Tesla T4

操作系统
根据实例使用的镜像选择对应的Linux操作系统版本。
说明
操作系统选择Linux 64-bit即表示下载shell安装文件。如果选择具体的发行版本,则下载的文件是对应的包安装文件。
Linux 64-bit
CUDA Toolkit
选择CUDA Toolkit版本。
12.2
语言
选择驱动对应的语言。
Chinese (Simplified)
  1. 选择特定的版本单击“查看”按钮。本文以下载535.216.03版本为例,如下图所示。

alt

  1. 在驱动下载页面,右键单击“下载”按钮,在弹出的菜单中选择“复制链接地址”。

alt

  1. 登录GPU实例。

  1. 使用wget命令,粘贴步骤4中已获取的链接地址,下载安装包(需要GPU实例能访问外网)。例如:

wget https://cn.download.nvidia.com/tesla/535.216.03/NVIDIA-Linux-x86_64-535.216.03.run
  1. (条件必选) 若您的实例使用“veLinux 1.0 CentOS兼容版 with 5.10 kernel”或“veLinux 1.0 CentOS兼容版”镜像,需执行以下命令,修改GNU编译器套件(GNU Compiler Collection,GCC)的默认版本。

source /opt/rh/devtoolset-8/enable
  1. 执行sh命令,运行驱动安装程序,并按提示进行后续操作。

sh NVIDIA-Linux-x86_64-535.216.03.run
  1. 安装完成后,执行以下命令进行验证。

nvidia-smi
如返回类似下图中的GPU信息,则说明GPU驱动安装成功。

alt

安装GPU驱动(Windows)

  1. 登录Windows实例。

  1. 在远程桌面中,通过浏览器访问NVIDIA 驱动下载。

  1. 设置搜索条件,单击“查找”按钮查找符合条件的驱动版本。本文以Tesla T4安装CUDA 11.4对应的GPU驱动版本为例,如下图所示。

alt

  1. 选择特定的版本单击“查看”按钮。本文以下载472.50版本为例,如下图所示。

alt

  1. 单击“下载”按钮,下载驱动。

alt

  1. 依次单击“运行”和“查看下载”按钮,待下载完成后单击“OK”按钮并按提示完成安装。

alt

  1. 安装完成后,在桌面单击右键,可以看到“NVIDIA控制面板”程序,单击后选择控制面板左下角的“系统信息”按钮,可以查看驱动版本。

alt


火山引擎GPU云服务器使用指南-HPC搭建Slurm计算集群

  • 火山引擎GPU云服务器使用指南-HPC配置NCCL

    火山引擎GPU云服务器使用指南-HPC配置NCCL

  • 火山引擎GPU云服务器指南-搭建AIGC能力(Windows)

    火山引擎GPU云服务器指南-搭建AIGC能力(Windows)

  • 火山引擎GPU云服务器指南-搭建AIGC能力(Linux)

    火山引擎GPU云服务器指南-搭建AIGC能力(Linux)

  • 火山引擎GPU云服务器指南-部署Pytorch应用

    火山引擎GPU云服务器指南-部署Pytorch应用

  • 794文章数 0评论数
    热门文章
    最近发表

    火山引擎GPU云服务器使用指南-HPC搭建Slurm计算集群

    2025-04-23
  • 火山引擎GPU云服务器使用指南-HPC配置NCCL
  • 标签列表
    请关注微信公众号
    微信二维码
    不容错过
    Powered By TOPYUN 云产品资讯