PAI提供了视频分类和物体标记模板。创建标注任务时,可以根据应用场景选择标注模板。
视频分类
视频分类(Video Classification)是指在一组固定的分类标签集合中,找出与输入视频内容相匹配的一个或多个分类标签,并将其分配给该输入视频。该模板支持单标签和多标签分类。
- 应用场景
视频监控、直播推荐及短视频推荐等。
- 数据结构
- 输入数据
manifest文件的每行数据是一道题目,且每行数据必须包含videoUrl字段。
{"data":{"videoUrl":"oss://xxxxxxxxx.oss-cn-shanghai-internal.aliyuncs.com/video/English.mp4"}}
- 输出数据
manifest文件的每行数据由题目和标注结果一起生成。每行数据的JSON结构如下。
{ "data": { "videoUrl": "oss://xxxxxxxxxxx.oss-cn-shanghai-internal.aliyuncs.com/video/show.webm" }, "label-bo0pc51ok7olwe****": { "results": [{ "data": [{ "data": ["汽车推广", "宣传片"], "id": 165****, "type": "survey/multivalue" }], "id": "165****", "type": "survey" }] } }
- 输入数据
物体标记
物体标记(Object Marking)是指对视频中某一帧或某些帧出现的特定物体进行定位并标记,常用矩形框工具或多边形框工具。
- 应用场景
自动驾驶、安防监控及视频推荐等。
- 数据结构
- 输入数据
manifest文件的每行数据是一道题目,且每行数据必须包含videoUrl字段。
{"data":{"videoUrl":"oss://xxxxxxxxx.oss-cn-shanghai-internal.aliyuncs.com/video/English.mp4"}}
- 输出数据
manifest文件的每行数据由题目和标注结果一起生成,标注结果中包含多帧(Frame)的标注结果。每行数据的JSON结构如下。
{ "data": { "videoUrl": "oss://xxxxxxxxx.oss-cn-shanghai-internal.aliyuncs.com/video/English.mp4" }, "label-rv0ih5l409u9x9****": { "results": [{ "data": [{ "speed_of_play": 1, "duration": 300.733375, "width": 960, "number_of_frames": 9022, "type": "video/meta", "frame_rate": 30, "height": 540 }, { "frames": { "frame-443": { "L6G-5Oc5STCSOuzKb****": { "rotation": 0, "x": 336.0483870967742, "width": 488.4677419354839, "y": 108.87096774193549, "height": 349.83870967741933 } } }, "type": "video/frames" }, { "frames": [443], "custom": { "这是什么类型的视频": "学习英语视频", "视频名称": "英语学习", "视频类别": ["教育片"] }, "id": "L6G-5Oc5STCSOuzKb****", "type": "video/rectangleLabel", "value": "", "labelColor": "#ff7700" }], "id": "129****", "type": "video" }] } }
- 输入数据