导入已标注数据方式说明
如果您已有标注好的数据,可以在BML平台直接导入,方便直接进入后续训练环节。
向选定的数据集导入已标注好的数据有两种方式:
1、将单张图片和对应图片的标注信息以json格式上传
2、将BML其他数据集已经标注好的数据导入
从本地导入已标注数据
图像分类数据从本地导入已标注好的数据,支持整体以一个.zip格式的压缩包上传。单次上传压缩包整体大小不超过5G
注意,为了使平台能正确解析标注图片,请按照以下方式整理标注文件再打包上传
1、图片及对应的标注文件一一对应,是文件名需要完全相同,否则会导入失败。
- 图片格式要求
- 图片类型为jpg/png/ bmp/jpeg 。
- 图片大小限制在4M内,长宽比在3:1以内,其中最长边需要小于4096px,最短边需要大于30px。
- 每个账户图片数据量限制为20w张,超出后可被忽略。如需扩容,请提交工单申请
- 特别注意:
- 对同一数据集存在多个内容完全一致的图片,将会做去重处理。
- 为保证模型训练效果,所上传的图片应与实际业务场景的图片(光线、角度、采集设备)尽可能一致
2、json文件内容格式示例如下:
单图单标签
{
"labels":
[
{"name": "Drama"}
]
}
单图多标签
{
"labels":
[
{"name": "Drama"},
{"name": "Romance"}
]
}
从已有数据集导入已标注数据
从已有数据集导入已标注数据,支持选择数据集及导入的具体标签进行导入。
查看已标注数据
导入数据完成后,可以在数据集查看-已标注查看到分标签的图片列表