208
云计算
负载均衡
产品简介
产品价格
快速入门
用户指南
实践操作
常见问题
购买指南
云服务器
产品简介
计费规则
购买指导
控制台使用指南
常见问题
云数据库
产品简介
计费规则
购买指导
快速入门
连接实例
控制台使用指南
对象存储
产品简介
控制台使用指南
程序员百科
Python
百度文心千帆大模型平台使用指南-如何查看、发布、处理和删除数据?

产品推荐:

1、安全稳定的云服务器租用,2核/2G/5M仅37元,点击抢购>>>

2、高防物理服务器20核/16G/50M/500G防御仅350元,点击抢购>>>

3、百度智能建站(五合一网站)仅880元/年,点击抢购>>> 模板建站(PC+手机站)仅480元/年,点击抢购>>>

4、阿里云服务器2核2G3M仅99元/年、2核4G5M仅199元/年,新老同享,点击抢购>>> 

5、腾讯云服务器2核2G4M仅99元/年、新老同享,点击抢购>>>   



点击这里点击这里申请百度智能云特邀VIP帐号,立即体验文心千帆>>>

百度文心千帆大模型平台使用指南-如何查看、发布、处理和删除数据?

登录到文心千帆大模型操作台,在左侧功能列选择数据集管理,进入数据集管理主任务界面。

查看数据

平台支持您查看全部数据、有标注信息的数据和无标注信息的数据。
点击指定数据集版本操作列的“详情”按钮,查看全部数据、有标注信息的数据和无标注信息的数据。并且支持根据导入日期、标注日期等条件进行筛选。

image.png

query问题集无需标注,没有标注日期的筛选项

发布数据

数据集发布后,方可在模型开发阶段引用该数据集做训练。

前提条件

该数据集已完成始标注,query问题集无需标注,可直接发布。

步骤

  1. 在对应数据集的操作列中选择“发布”。
  2. 数据集发布成功后,该数据集的发布状态为变为“已发布 。

已发布的数据集不允许任何编辑操作

处理数据

数据在未发布前可以进行数据的清洗和增强。

  • 数据清洗:可以对数据集中的文本进行繁体转简体、大写转小写、删除异常字符等操作。详细可查看数据清洗操作。
  • 数据增强:通过数据增强策略,对数据本身进行一定程度的扰动和扩充,从而产生"新"数据。在训练时会通过学习大量的"新"数据,提高模型的泛化能力。详细可查看数据增强操作。

删除数据

  • 如果您需要删除数据集,请执行下面步骤:

选定某个数据集,选择“删除”按钮。

image.png

确认删除数据集后,数据集及全部版本数据都将会被删除且不可恢复。

  • 如果您需要删除数据集的某个版本,请执行以下步骤:

    选定数据集的某个版本,选择“删除”按钮。

image.png

删除后,数据集版本不可恢复。


这条帮助是否解决了您的问题? 已解决 未解决

提交成功!非常感谢您的反馈,我们会继续努力做到更好! 很抱歉未能解决您的疑问。我们已收到您的反馈意见,同时会及时作出反馈处理!