百度文心千帆大模型平台使用指南-怎么查看与管理模型评估任务? | ||||||||||||||
产品推荐: 1、安全稳定的云服务器租用,2核/2G/5M仅37元,点击抢购>>>; 2、高防物理服务器20核/16G/50M/500G防御仅350元,点击抢购>>> 3、百度智能建站(五合一网站)仅880元/年,点击抢购>>> 模板建站(PC+手机站)仅480元/年,点击抢购>>> 4、阿里云服务器2核2G3M仅99元/年、2核4G5M仅199元/年,新老同享,点击抢购>>> 5、腾讯云服务器2核2G4M仅99元/年、新老同享,点击抢购>>> 点击这里申请百度智能云特邀VIP帐号,立即体验文心千帆>>> 百度文心千帆大模型平台使用指南-怎么查看与管理模型评估任务? 对生成式大模型的输出效果、计算性能进行全方位评价,提供面向事实类或开放性问答的不同打分模式;当前支持文本类生成模型,暂不支持图像或跨模态生成模型。 登录到文心千帆大模型操作台,在左侧功能列选择模型评估,进入模型评估主任务界面。 查看模型评估任务详情进入“模型评估 > 查看报告 > 任务详情”中查看模型评估任务详情页。 查看评估报告进入“模型评估 > 查看报告 > 评估报告 ”中查看评估指标。
注释: 导出错例数据评估报告中,错例分析 区域展示了BLUE-4指标较低的样本,以便用户针对性分析和迭代模型;为避免对页面性能造成影响,每个模型最多展示2000条错例样本。 错例支持筛选和导出。导出时点击左上角按钮,在浮窗中配置导出位置『本地』或『BOS存储』(需提前开通BOS相关服务 )。 右上角 操作记录中支持查看用户对错例导出记录,查看导出任务状态、并对错例数据进行下载、查看。 查看任务日志平台支持查看本次模型评估任务的详细日志。选择评估的模型后,可以查看其从创建开始到任务结束的日志内容,支持下载到本地保存(txt格式)。 以下为部分日志展示: 可通过日志查看报错,调整任务配置重新发起;或在提交工单时,粘贴日志中的报错由百度技术服务团队协助排查。 |