👉点击这里申请火山引擎VIP帐号,立即体验火山引擎产品>>>
背景信息
环境要求
类型 | 实例规格 | vCPU | 内存(GiB) | 操作系统 |
推荐 | ecs.c3i.24xlarge | 96 | 192 | Ubuntu 22.04 |
性价比最佳 | ecs.g3i.8xlarge | 32 | 128 | Ubuntu 22.04 |
最小配置 | ecs.r3i.4xlarge | 16 | 128 | Ubuntu 22.04 |
Anaconda:获取包且对包能够进行管理的工具,包含了Conda、Python在内的超过180个科学包及其依赖项,用于创建Python虚拟环境。本文以Anaconda 3和Python 3.8.3为例。
Transformers:一种神经网络架构,用于语言建模、文本生成和机器翻译等任务。本文以4.33.2为例。
Gradio:快速构建机器学习Web展示页面的开源Python库。本文以3.44.4为例。
使用说明
操作步骤
步骤一:创建实例
请参考通过向导购买实例创建一台符合以下条件的实例:
基础配置:
计算规格:ecs.c3i.24xlarge
镜像:Ubuntu 22.04
存储:云盘容量在100 GiB以上
网络配置:勾选“分配弹性公网IP”。
创建成功后,在实例绑定的安全组中添加入方向规则:放行TCP 7860端口,具体操作请参见修改安全组访问规则。
步骤二:创建虚拟环境
执行以下命令,下载Anaconda安装包。
wget https://repo.anaconda.com/archive/Anaconda3-2022.05-Linux-x86_64.sh
执行以下命令,安装Anaconda。
bash Anaconda3-2022.05-Linux-x86_64.sh
持续按“Enter”键进行安装。
输入“yes”,并按“Enter”键确认信息。
Anaconda的安装路径/root/anaconda3,请按“Enter”键确认安装。
输入“yes”,并按“Enter”键确定初始化Anaconda。
执行以下命令使配置文件生效。
source ~/.bashrc
创建一个名为“SPR”的虚拟环境,并指定该环境中的python版本为3.8.3。
执行如下命令。
conda create -n SPR python=3.8.3
回显Proceed ([y]/n)?时输入“y”回车确认。
执行以下命令,激活虚拟环境。
conda activate SPR
步骤三:部署模型并验证
执行以下命令,下载ChatGLM-6B大模型的权重文件。
wget https://ai-llm.tos-cn-beijing.volces.com/chatglm-6b/GLM-6B-SPR.tar.gz
执行以下命令,解压文件包。
tar -zxvf GLM-6B-SPR.tar.gz
执行以下命令,安装相应的Intel依赖包。
pip install mkl==2023.1.0 intel-openmp==2023.1.0
依次执行以下命令,在Conda环境下安装内存分配器Jemalloc。
conda install jemallocpip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpupip install transformers
安装Gradio。
执行pip install gradio sentencepiece命令,安装Gradio。
执行pip list | grep gradio命令进行验证,回显如下表示已成功安装。
修改源。
执行vim /etc/apt/sources.list命令,打开源文件。
按i进入编辑模式,添加如下内容。
deb http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiversedeb-src http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiversedeb http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiversedeb-src http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiversedeb http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiversedeb-src http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiversedeb http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiversedeb-src http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiversedeb http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiversedeb-src http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse
按esc退出编辑模式,输入:wq并按Enter键,保存并退出文件。
执行apt update命令,更新软件包。
依次执行以下命令安装依赖包。
cd bloom #切换至bloom目录pip install bloom_fp16-0.0.0-cp38-cp38-linux_x86_64.whlpip install chatglm_hybrid-0.0.0-cp38-cp38-linux_x86_64.whlpip install chatglm_fp32-0.0.0-cp38-cp38-linux_x86_64.whlapt install numactl
安装完成后,执行cd命令退出当前目录。
修改chatglm/webui目录下的demo文件导出路径,加载本地ChatGLM模型。
执行vim read_path.py命令,新建寻址文件,并添加如下内容。
import torchimport osimport sysdef get_pytorch_install_dir():return os.path.dirname(os.path.abspath(torch.__file__))pytorch_install_dir = get_pytorch_install_dir()python_dir = sys.prefixprint("PyTorch Library Path: " + pytorch_install_dir)print("Python Library Path: " + python_dir + "/lib")print("MKL Dynamic Library Path: " + python_dir + "/lib/libmkl_rt.so.2")
按esc退出编辑模式,输入:wq并按Enter键,保存并退出文件。
依次执行以下命令,查看Dynamic路径。
cd chatglmpython read_path.py
执行以下命令,打开demo文件。
按i进入编辑模式,修改导出路径为root/anaconda3(与Dynamic保持一致),如下图所示。
依次执行以下命令,运行start_demo.sh*脚本。
cd webui./start_demo.sh*
浏览器访问public URL(https://<公网IP>.gradio.live),如下图所示,表示成功使用Gradio构建AI应用程序。