火山引擎云服务器实践教程-搭建ChatGLM-6B大语言模型

axin 2025-04-03 共205人围观，发现0个评论火山引擎云服务器云服务器云服务器教程

本文以搭载了第四代英特尔® 至强® 可扩展处理器（Sapphire Rapids）的计算型ecs.c3i.24xlarge为例，为您介绍如何在ECS云服务器上部署ChatGLM-6B大语言模型。

背景信息

ChatGLM-6B是一个具有62亿参数的、支持中英双语问答的对话语言模型，基于General Language Model（GLM）架构，结合模型量化技术，支持在消费级的显卡上进行本地部署（INT4量化级别下最低只需6GB显存）。ChatGLM-6B使用了和ChatGLM相同的技术，针对中文问答和对话进行了优化。经过约1T标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62亿参数的ChatGLM-6B已经能生成相当符合人类偏好的回答。

环境要求

实例配置

部署ChatGLM-6B模型，推荐的实例配置如下：

类型
实例规格
vCPU
内存（GiB）
操作系统
推荐
ecs.c3i.24xlarge
96
192
Ubuntu 22.04
性价比最佳
ecs.g3i.8xlarge
32
128
Ubuntu 22.04
最小配置
ecs.r3i.4xlarge
16
128
Ubuntu 22.04

运行环境

Anaconda：获取包且对包能够进行管理的工具，包含了Conda、Python在内的超过180个科学包及其依赖项，用于创建Python虚拟环境。本文以Anaconda 3和Python 3.8.3为例。

Transformers：一种神经网络架构，用于语言建模、文本生成和机器翻译等任务。本文以4.33.2为例。

Gradio：快速构建机器学习Web展示页面的开源Python库。本文以3.44.4为例。

使用说明

下载本文所需软件需要访问国外网站，建议您增加网络代理（例如FlexGW）以提高访问速度。您也可以将所需软件下载到本地，参考本地数据上传到实例中。

操作步骤

步骤一：创建实例

请参考通过向导购买实例创建一台符合以下条件的实例：

基础配置：

计算规格：ecs.c3i.24xlarge

镜像：Ubuntu 22.04

存储：云盘容量在100 GiB以上

alt

网络配置：勾选“分配弹性公网IP”。

创建成功后，在实例绑定的安全组中添加入方向规则：放行TCP 7860端口，具体操作请参见修改安全组访问规则。

步骤二：创建虚拟环境

执行以下命令，下载Anaconda安装包。

wget https://repo.anaconda.com/archive/Anaconda3-2022.05-Linux-x86_64.sh

执行以下命令，安装Anaconda。

bash Anaconda3-2022.05-Linux-x86_64.sh

持续按“Enter”键进行安装。

alt

输入“yes”，并按“Enter”键确认信息。

alt

Anaconda的安装路径/root/anaconda3，请按“Enter”键确认安装。

alt

输入“yes”，并按“Enter”键确定初始化Anaconda。

alt

执行以下命令使配置文件生效。

source ~/.bashrc

回显如下，表示配置成功，进入base环境。

alt

创建一个名为“SPR”的虚拟环境，并指定该环境中的python版本为3.8.3。

执行如下命令。

conda create -n SPR python=3.8.3

回显Proceed ([y]/n)?时输入“y”回车确认。

执行以下命令，激活虚拟环境。

conda activate SPR

回显如下，表示激活成功。

alt

步骤三：部署模型并验证

执行以下命令，下载ChatGLM-6B大模型的权重文件。

wget https://ai-llm.tos-cn-beijing.volces.com/chatglm-6b/GLM-6B-SPR.tar.gz

执行以下命令，解压文件包。

tar -zxvf GLM-6B-SPR.tar.gz

执行ll命令查看解压后的文件列表，如下图所示。

alt

执行以下命令，安装相应的Intel依赖包。

pip install mkl==2023.1.0 intel-openmp==2023.1.0

依次执行以下命令，在Conda环境下安装内存分配器Jemalloc。

conda install jemallocpip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpupip install transformers

安装Gradio。

执行pip install gradio sentencepiece命令，安装Gradio。

执行pip list | grep gradio命令进行验证，回显如下表示已成功安装。

alt

修改源。

执行vim /etc/apt/sources.list命令，打开源文件。

按i进入编辑模式，添加如下内容。

deb http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiversedeb-src http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiversedeb http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiversedeb-src http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiversedeb http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiversedeb-src http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiversedeb http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiversedeb-src http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiversedeb http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiversedeb-src http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse

按esc退出编辑模式，输入:wq并按Enter键，保存并退出文件。

执行apt update命令，更新软件包。

依次执行以下命令安装依赖包。

cd bloom  #切换至bloom目录pip install bloom_fp16-0.0.0-cp38-cp38-linux_x86_64.whlpip install chatglm_hybrid-0.0.0-cp38-cp38-linux_x86_64.whlpip install chatglm_fp32-0.0.0-cp38-cp38-linux_x86_64.whlapt install numactl

修改chatglm/webui目录下的demo文件导出路径，加载本地ChatGLM模型。

执行vim read_path.py命令，新建寻址文件，并添加如下内容。

import torchimport osimport sysdef get_pytorch_install_dir():return os.path.dirname(os.path.abspath(torch.__file__))pytorch_install_dir = get_pytorch_install_dir()python_dir = sys.prefixprint("PyTorch Library Path: " + pytorch_install_dir)print("Python Library Path: " + python_dir + "/lib")print("MKL Dynamic Library Path: " + python_dir + "/lib/libmkl_rt.so.2")

按esc退出编辑模式，输入:wq并按Enter键，保存并退出文件。

依次执行以下命令，查看Dynamic路径。

cd chatglmpython read_path.py

如下图，本例中的Dynamic路径为root/anaconda3。

alt

执行以下命令，打开demo文件。

vim /root/chatglm/webui/start_demo.sh*

按i进入编辑模式，修改导出路径为root/anaconda3（与Dynamic保持一致），如下图所示。

alt

依次执行以下命令，运行start_demo.sh*脚本。

cd webui./start_demo.sh*

alt

浏览器访问public URL（https://<公网IP>.gradio.live），如下图所示，表示成功使用Gradio构建AI应用程序。

alt

上一篇：火山引擎云服务器实践教程-搭建多个Web站点（Windows）下一篇：火山引擎云服务器实践教程-搭建SDXL-Turbo模型文生图推理

火山引擎云服务器实践教程-搭建ChatGLM-6B大语言模型

背景信息

环境要求

使用说明

操作步骤

步骤一：创建实例

步骤二：创建虚拟环境

步骤三：部署模型并验证

最近文章

云服务器 2 核 4G10M 配置详解，新手也能轻松上手使用

2 核 4G10M 云服务器带防御功能，有效抵御网络攻击

电商小店铺适用，2 核 4G10M 云服务器承载日常交易

铂金CPU云服务器租用百问-日志分析工具集成？

个人网站云服务器租用百问-是否支持WAF（Web应用防火墙）？

云服务器租用百问-能挂载多个数据盘吗？

铂金CPU云服务器租用百问-与黄金CPU的成本性能对比？

关于我们

广告服务

关注我们

赞助商

类型	实例规格	vCPU	内存（GiB）	操作系统
推荐	ecs.c3i.24xlarge	96	192	Ubuntu 22.04
性价比最佳	ecs.g3i.8xlarge	32	128	Ubuntu 22.04
最小配置	ecs.r3i.4xlarge	16	128	Ubuntu 22.04

火山引擎云服务器实践教程-搭建ChatGLM-6B大语言模型

背景信息

环境要求

使用说明

操作步骤

步骤一：创建实例

步骤二：创建虚拟环境

步骤三：部署模型并验证

最近文章

云服务器 2 核 4G10M 配置详解，新手也能轻松上手使用​

2 核 4G10M 云服务器带防御功能，有效抵御网络攻击​

电商小店铺适用，2 核 4G10M 云服务器承载日常交易​

铂金CPU云服务器租用百问-日志分析工具集成？

个人网站云服务器租用百问-是否支持WAF（Web应用防火墙）？

云服务器租用百问-能挂载多个数据盘吗？

铂金CPU云服务器租用百问-与黄金CPU的成本性能对比？

关于我们

广告服务

关注我们

赞助商

云服务器 2 核 4G10M 配置详解，新手也能轻松上手使用

2 核 4G10M 云服务器带防御功能，有效抵御网络攻击

电商小店铺适用，2 核 4G10M 云服务器承载日常交易