全部产品
Search
文档中心

人工智能平台 PAI:iTAG概述

更新时间:Oct 10, 2025

iTAG是PAI的数据标注平台,提供多种标注模板,支持图像、文本、视频、音频等数据类型的标注以及多模态标注。

支持的标注任务

iTAG预置了标注模板,可支持以下类型的标注任务:

  • 图像类:图像分类、目标检测、图像OCR、表格识别、图像语义分割。

  • 文本类:文本分类、命名实体识别、实体关系识别。

  • 视频类:视频分类、视频打点、视频OCR。

  • 音频类:音频分类、音频分割、音频识别。

  • 大模型类:视觉问答、多模态RLHF标注、图生文、图文解释、对话改写、对话排序、对话分组。

除控制台中直接提供的文本分类、图像分类等标注模板外,其他标注模板使用方法请参见模板管理

使用流程

  1. 创建数据集

    将待标注数据上传至对象存储OSS,然后通过数据集管理模块,从OSS路径导入数据以创建数据集。系统将为数据生成一个.manifest格式的索引文件(一种包含数据路径和元信息的JSONL文件),用于后续的标注任务。

    重要

    目前iTAG仅支持数据存储在OSS,为确保正常访问,OSS Bucket 所在地域需与 PAI 保持一致。

  2. 创建标注任务

    对于已创建的数据集,通过iTAG提供的通用模板或自定义模板创建标注任务并分发。任务分发流程分为标注、检查及验收三个环节,其中标注为必选环节,检查和验收为可选环节。各环节的主要作用如下:

    • 标注:标注员在标注任务页面,领取标注任务包,完成标注并提交。

    • 检查:标注员在检查任务页面,领取已经标注完成的任务包,进行检查、修改或驳回。

    • 验收:需求方在验收任务页面,领取相应任务包后,对其进行最后阶段的验收、修改或驳回。

  3. 处理标注任务

    按照任务流程为任务包进行标注、检查或验收,从而获得标注好的数据。

  4. 导出标注结果数据

    将标注结果导出至指定的OSS目录,用于模型训练。支持导出.manifest格式的标注结果数据。

计费说明

  • iTAG平台(免费):如果您使用iTAG平台并由您自己的团队进行纯人工标注,iTAG平台本身不收取任何费用。

  • 智能标注服务(免费):平台针对部分大模型标注模板(如图生文、图文解释等)提供的智能标注服务目前免费,后续如果收费将另行通知。

  • 对象存储OSS(收费):iTAG的运行依赖于阿里云对象存储OSS。因此,使用过程中产生的OSS存储和数据读写流量等费用,将按照OSS计费标准单独收取。

  • 人工标注外包服务(收费):如果需要委托阿里云的专业团队进行数据标注,请提交工单或加入钉钉群21930006619联系PAI团队获取该项付费服务。

获取帮助

如果您遇到数据加载出错、缺少操作权限、配置OSS跨域访问规则(CORS)等产品使用问题,请查阅iTAG常见问题