百度文心千帆大模型平台使用指南-SFT调优快速手册 |
产品推荐: 1、安全稳定的云服务器租用,2核/2G/5M仅37元,点击抢购>>>; 2、高防物理服务器20核/16G/50M/500G防御仅350元,点击抢购>>> 3、百度智能建站(五合一网站)仅880元/年,点击抢购>>> 模板建站(PC+手机站)仅480元/年,点击抢购>>> 4、阿里云服务器2核2G3M仅99元/年、2核4G5M仅199元/年,新老同享,点击抢购>>> 5、腾讯云服务器2核2G4M仅99元/年、新老同享,点击抢购>>> 点击这里申请百度智能云特邀VIP帐号,立即体验文心千帆>>> 百度文心千帆大模型平台使用指南-SFT调优快速手册 SFT(有监督微调)概述什么是SFT监督微调(SFT)是指采用预先训练好的神经网络模型,并针对你自己的专门任务在少量的监督数据上对其进行重新训练的技术。在千帆平台上已经预置了ERNIE-Bot系列大模型和BLOOM系列大模型。 SFT在大语言模型中的应用有以下重要原因:
准备数据1.LLM大语言模型所需SFT数据为每个示例准备文本输入和标签,以问答形式呈现,如下所示:
问答格式可以处理成多种文件格式, 例如JSONL, Excel File, CSV; 核心是要保持两个独立的字段, 即问题和答案。 2.Prompt优化
3.数据规模、数据多样性在SFT上数据规模的重要性低于数据质量, 通常1万条左右的精标数据即可发挥良好的效果。 4.数据质量挑选质量较高的数据,可以有效提高模型的性能。 数据质量用户需尽量自己把控,避免出现一些错误,或者无意义的内容。虽然平台也可以提供数据质量筛选的能力,但不可避免出现错筛的情况。 选择SFT的超参数
|