百度文心千帆大模型平台使用指南-如何导入文本对话数据? | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
产品推荐: 1、安全稳定的云服务器租用,2核/2G/5M仅37元,点击抢购>>>; 2、高防物理服务器20核/16G/50M/500G防御仅350元,点击抢购>>> 3、百度智能建站(五合一网站)仅880元/年,点击抢购>>> 模板建站(PC+手机站)仅480元/年,点击抢购>>> 4、阿里云服务器2核2G3M仅99元/年、2核4G5M仅199元/年,新老同享,点击抢购>>> 5、腾讯云服务器2核2G4M仅99元/年、新老同享,点击抢购>>> 点击这里申请百度智能云特邀VIP帐号,立即体验文心千帆>>> 百度文心千帆大模型平台使用指南-如何导入文本对话数据? 登录到文心千帆大模型操作台,在左侧功能列选择数据集管理,进入数据集管理主任务界面。 导入数据创建数据集完成后,在数据集管理页面中,找到该数据集,点击右侧操作列下的“导入”按钮,即可进入导入数据页面。 您可以使用以下方案上传文本数据:
无标注信息无标注信息-本地导入本地导入支持五种导入格式:JSONL、TXT、CSV、XLSX、ZIP。 非排序样本数据:
含排序样本数据 含排序文本数据格式要求同非排序文本数据一致。 下载数据样例:JSONL、TXT、CSV 、XLSX、ZIP。 无标注信息-BOS目录导入请确保将全部文本已通过jsonl文件保存至同一层文件目录,该层目录下子文件目录及非相关内容(包括压缩包格式等)不导入。 需选择Bucket地址与对应的文件夹地址。
无标注信息-分享链接导入请确保将全部jsonl文本文件保存至同一压缩包,压缩包仅支持zip/tar.gz格式,压缩前源文件大小限制5G以内 需输入链接地址。分享链接导入的要求如下:
无标注信息-平台已有数据集
有标注信息有标注信息-本地导入本地导入支持两种导入格式:JSONL和ZIP。 非排序样本数据:
含排序样本数据
有标注信息-BOS目录导入请确保将全部文本已通过jsonl文件保存至同一层文件目录,该层目录下子文件目录及非相关内容(包括压缩包格式等)不导入。 需选择Bucket地址与对应的文件夹地址。
有标注信息-分享链接导入请确保将全部jsonl文本文件保存至同一压缩包,压缩包仅支持zip/tar.gz格式,压缩前源文件大小限制5G以内 需输入链接地址。分享链接导入的要求如下:
有标注信息-平台已有数据集
以上所有步骤完成后,即可导入数据至数据集。 |