全部產品
Search
文件中心

Platform For AI:標註檔案格式說明

更新時間:Jul 13, 2024

如果您需要根據已有資料產生TFRecord,則可以先將已有檔案轉換為PAI標註格式,再產生TFRecord。本文為您介紹標註檔案格式。

CSV資料格式如下。

欄位

資料類型

描述

資料ID

INT

資料標識

未經處理資料

JSON

包含圖片URL

融合答案

JSON

標註結果

映像分類

#資料ID,未經處理資料,融合答案
1,{"url":"http://a.jpg"},{"option":"護照"}
2,{"url":"http://b.jpg"},{"option":"護照"}

融合答案欄位說明如下。

{
    "option":"護照"    # 圖片類別。
}

映像多標籤分類

#資料ID,未經處理資料,融合答案
1,{"url":"http://a.jpg"},{["option":"護照", "option":"身份證"]}
2,{"url":"http://b.jpg"},{["option":"護照", "option":"港澳通行證"]}

融合答案欄位說明如下。

{
    "option":["護照", "身份證"]    # 圖片標籤。
}

物體檢測

#資料ID,未經處理資料,融合答案
1,{"url": "http://b.jpg"},[{"text": "{\"class*\": \"類別1\"}", "coord": ["306.73", "517.59", "324.42", "282.07", "347.69", "282.07", "333.73", "519.45"]}, {"text": "{\"class*\": \"類別2\"}", "coord": ["342.11", "723.32", "349.56", "608.81", "366.31", "606.95", "360.73", "730.76"]}]"
2,{"url": "http://a.jpg"},[{"text": "{\"class*\": \"類別1\"}", "coord": ["338.35", "8.53", "700.16", "8.53", "700.16", "50.35", "338.35", "50.35"]}, {"text": "{\"class*\": \"類別2\"}", "coord": ["26.88", "64.00", "218.03", "64.00", "218.03", "99.84", "26.88", "99.84"]}]"

融合答案欄位說明如下。

[        # 物體列表。
    {
        "text":"{\"class*\": \"類別1\"}",    # 物體類別,JSON字串。
        "coord":[    # 物體包圍盒頂點座標, x1,y1,x2,y2,x3,y3,x4,y4。
            "338.35",
            "8.53",
            "700.16",
            "8.53",
            "700.16",
            "50.35",
            "338.35",
            "50.35"
        ]
    },
    {
        "text":"{\"class*\": \"類別2\"}",
        "coord":[
            "26.88",
            "64.00",
            "218.03",
            "64.00",
            "218.03",
            "99.84",
            "26.88",
            "99.84"
        ]
    }
]

映像分割

樣本下載

#資料ID,未經處理資料,融合答案
1,{"http://a.jpg"},{"ossUrl":"http://ossgw.alicdn.com/a.png"}

融合答案欄位說明如下。

{
    "ossUrl":"http://ossgw.alicdn.com/a.png"
    # Mask圖片地址。Mask圖片為PNG格式,第2個通道(0開始)儲存類別資訊,
    # 取值從0到num_class-1。第一類通常為Background。
}

文字識別

#資料ID,未經處理資料,融合答案
1,{"url": "http://b.jpg"},{"text": "文本1"}
2,{"url": "http://a.jpg"},{"text": "文本2"}

融合答案欄位說明如下。

{
    "text":"文本1"    # 文字識別內容。
}

文字檢測

#資料ID,未經處理資料,融合答案
1,{"url": "http://b.jpg"},[[{"text": "{\"direction\": \"底部朝右\", \"class*\": \"類別1\"}", "coord": ["306.73", "517.59", "324.42", "282.07", "347.69", "282.07", "333.73", "519.45"]}, {"text": "{\"direction\": \"底部朝右\", \"class*\": \"類別2\"}", "coord": ["342.11", "723.32", "349.56", "608.81", "366.31", "606.95", "360.73", "730.76"]}], {"option": "底部朝右"}]
2,{"url": "http://a.jpg"},[[{"text": "{\"direction\": \"底部朝下\", \"class*\": \"類別1\"}", "coord": ["338.35", "8.53", "700.16", "8.53", "700.16", "50.35", "338.35", "50.35"]}, {"text": "{\"direction\": \"底部朝下\", \"class*\": \"類別2\"}", "coord": ["26.88", "64.00", "218.03", "64.00", "218.03", "99.84", "26.88", "99.84"]}], {"option": "底部朝下"}]

融合答案欄位說明如下。

[        # 文字行列表。
    [
        {
            "text":"{\"direction\": \"底部朝下\", \"class*\": \"類別1\"}",
                         # 文字行標註,JSON字串。其中direction表示文字行朝向,class*表示類別。
            "coord":[ # 文字行包圍盒頂點座標, x1,y1,x2,y2,x3,y3,x4,y4。
                "338.35",
                "8.53",
                "700.16",
                "8.53",
                "700.16",
                "50.35",
                "338.35",
                "50.35"
            ]
        },
        {
            "text":"{\"direction\": \"底部朝下\", \"class*\": \"類別2\"}",
            "coord":[
                "26.88",
                "64.00",
                "218.03",
                "64.00",
                "218.03",
                "99.84",
                "26.88",
                "99.84"
            ]
        }
    ],
    {
        "option":"底部朝下"    # 整體圖片朝向。
    }
]

圖片朝向分為底部朝下、底部朝上、底部朝左及底部朝右。

端到端的文字識別

#資料ID,未經處理資料,融合答案
1,{"url": "http://b.jpg"},"[[{"text": "{\"text\": \"文本1\", \"direction\": \"底部朝右\", \"class*\": \"類別1\"}", "coord": ["306.73", "517.59", "324.42", "282.07", "347.69", "282.07", "333.73", "519.45"]}, {"text": "{\"text\": \"文本2\", \"direction\": \"底部朝右\", \"class*\": \"類別2\"}", "coord": ["342.11", "723.32", "349.56", "608.81", "366.31", "606.95", "360.73", "730.76"]}], {"option": "底部朝右"}]
2,{"url": "http://a.jpg"},"[[{"text": "{\"text\": \"文本3\", \"direction\": \"底部朝下\", \"class*\": \"類別1\"}", "coord": ["338.35", "8.53", "700.16", "8.53", "700.16", "50.35", "338.35", "50.35"]}, {"text": "{\"text\": \"文本4\", \"direction\": \"底部朝下\", \"class*\": \"類別2\"}", "coord": ["26.88", "64.00", "218.03", "64.00", "218.03", "99.84", "26.88", "99.84"]}], {"option": "底部朝下"}]

融合答案欄位說明如下。

[        # 文字行列表。
    [
        {
            "text":"{\"text\": \"文本3\", "\"direction\": \"底部朝下\", \"class*\": \"類別1\"}",
                         # 文字行標註,JSON字串。其中direction表示文字行朝向,class*表示類別。                         
            "coord":[ # 文字行包圍盒頂點座標, x1,y1,x2,y2,x3,y3,x4,y4。
                "338.35",
                "8.53",
                "700.16",
                "8.53",
                "700.16",
                "50.35",
                "338.35",
                "50.35"
            ]
        },
        {
            "text":"{\"text\": \"文本4\", \"direction\": \"底部朝下\", \"class*\": \"類別2\"}",
            "coord":[
                "26.88",
                "64.00",
                "218.03",
                "64.00",
                "218.03",
                "99.84",
                "26.88",
                "99.84"
            ]
        }
    ],
    {
        "option":"底部朝下"    # 整體圖片朝向。
    }
]

圖片朝向分為底部朝下、底部朝上、底部朝左及底部朝右。