百度文心千帆大模型平台使用指南-如何创建大模型调优任务? | ||||||||||||||||||||||||||||||
百度文心千帆大模型平台使用指南-如何创建大模型调优任务? 大模型调优实际上是Fine-Tuning的训练模式,开发者可以选择适合自己任务场景的训练模式并加以调参训练,从而实现理想的模型效果。 登录到文心千帆大模型操作台,在左侧功能列选择大模型调优,进入大模型调优主任务界面。 创建任务您需要在大模型调优任务界面,选择“创建调优任务”按钮。 填写好任务名称后,在范围内选择所属行业和应用场景,再进行500字内的业务描述即可。 创建并训练直接开启训练模型的运行配置界面;“完成创建”仅创建任务不创建训练模型的运行。 新建运行您可以在创建任务时选择“创建并训练”,或者在大模型调优任务列表中,选择指定任务的“新建运行”按钮。 训练配置训练配置大模型参数,调整好基本配置。 ·ERNIE-Bot-turbo百度自行研发的大语言模型,覆盖海量中文数据,具有更强的对话问答、内容创作生成等能力。
·BLOOMZ-7B知名的大语言模型,由HuggingFace研发并开源,能够以46种语言和13种编程语言输出文本。
数据配置训练任务的选择数据及相关配置,大模型调优任务需要匹配多轮对话-非排序类的数据集。 建议数据集总条数在1000条以上,训练模型更加精准。 数据集来源可以为千帆平台已发布的数据集版本,也可以为已有数据集的BOS地址,详细内容可查看数据集部分内容。 需注意:当选择BOS目录导入数据集时,数据放在jsonl文件夹下。您需要选择jsonl的父目录:
百度BOS服务开通申请。 以上所有操作完成后,点击“开始训练”,则发起模型训练的任务。 |