百度文心千帆大模型平台使用指南-怎么创建模型评估任务？

百度文心千帆大模型平台使用指南-怎么创建模型评估任务？

什么是评估数据集

在人工智能模型开发过程中，通常是将数据集划分为训练集、验证集和测试集三个部分。其中，训练集用来训练模型，验证集则用于调整模型的超参数和选择合适的模型，而测试集则是在模型训练完成后，用于最终评估模型的性能，这就是评估数据集（即测试集）。

评估数据集通常是在与训练数据集相似的情况下收集的，因此可以用来代表真实世界的样本数据。通过对评估数据集的评估，可以了解模型在不同场景下的表现，从而更好地优化模型。同时，评估数据集还可以用来验证模型的泛化能力，即模型在未见过的数据上的表现如何。

登录到文心千帆大模型操作台，在左侧功能列选择模型评估，进入模型评估主任务界面。

点击“创建评估任务”按钮，进入新建评估任务页面。(若没有该按钮，请查看任务计费说明）

由用户填写评估任务所需的基本信息、评估配置、资源配置。

基本信息

填写评估任务名称、评估任务描述

评估配置

资源配置

配置模型评估的资源环境和计算节点数后，点击“确认”按钮开始进行模型评估任务。(详细计费规则请见任务计费说明）

当前模型评估功能限时免费.