百度文心千帆大模型平台使用指南-如何导入文本对话数据? | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
百度文心千帆大模型平台使用指南-如何导入文本对话数据? 登录到文心千帆大模型操作台,在左侧功能列选择数据集管理,进入数据集管理主任务界面。 导入数据创建数据集完成后,在数据集管理页面中,找到该数据集,点击右侧操作列下的“导入”按钮,即可进入导入数据页面。 您可以使用以下方案上传文本数据:
无标注信息无标注信息-本地导入本地导入支持五种导入格式:JSONL、TXT、CSV、XLSX、ZIP。 非排序样本数据:
含排序样本数据 含排序文本数据格式要求同非排序文本数据一致。 下载数据样例:JSONL、TXT、CSV 、XLSX、ZIP。 无标注信息-BOS目录导入请确保将全部文本已通过jsonl文件保存至同一层文件目录,该层目录下子文件目录及非相关内容(包括压缩包格式等)不导入。 需选择Bucket地址与对应的文件夹地址。
无标注信息-分享链接导入请确保将全部jsonl文本文件保存至同一压缩包,压缩包仅支持zip/tar.gz格式,压缩前源文件大小限制5G以内 需输入链接地址。分享链接导入的要求如下:
无标注信息-平台已有数据集
有标注信息有标注信息-本地导入本地导入支持两种导入格式:JSONL和ZIP。 非排序样本数据:
含排序样本数据
有标注信息-BOS目录导入请确保将全部文本已通过jsonl文件保存至同一层文件目录,该层目录下子文件目录及非相关内容(包括压缩包格式等)不导入。 需选择Bucket地址与对应的文件夹地址。
有标注信息-分享链接导入请确保将全部jsonl文本文件保存至同一压缩包,压缩包仅支持zip/tar.gz格式,压缩前源文件大小限制5G以内 需输入链接地址。分享链接导入的要求如下:
有标注信息-平台已有数据集
以上所有步骤完成后,即可导入数据至数据集。 |