全部产品
Search
文档中心

Platform For AI:Ikhtisar

更新时间:Jun 22, 2025

Untuk mengonversi file yang ada ke file TFRecord, Anda harus terlebih dahulu mengonversinya menjadi dataset berlabel menggunakan Machine Learning Platform for AI (PAI). Setelah itu, dataset berlabel dapat dikonversi menjadi file TFRecord. Topik ini menjelaskan format entri dalam dataset berlabel untuk klasifikasi gambar satu label, klasifikasi gambar multi-label, deteksi objek, segmentasi gambar, pengenalan teks, dan deteksi teks.

Tabel berikut menjelaskan elemen-elemen dalam file CSV yang berisi data berlabel.

Elemen

Tipe data

Deskripsi

ID Entri

INT

ID dari entri.

Data mentah

JSON

URL gambar sumber.

Hasil pelabelan

JSON

Hasil pelabelan.

Klasifikasi gambar satu label

# ID entri, data mentah, dan hasil pelabelan.
1,{"url":"http://a.jpg"},"{"option":"Passport"}
2,{"url":"http://b.jpg"},"{"option":"Passport"}

Hasil Pelabelan mencakup informasi berikut:

{
    "option":"Passport"    # Label dari gambar.
}

Klasifikasi gambar multi-label

# ID entri, data mentah, dan hasil pelabelan.
1,{"url":"http://a.jpg"},{["option":"Passport", "option":"ID card"]}
2,{"url":"http://b.jpg"},{["option":"Passport", "option":"Exit-Entry Permit for Traveling to and from Hong Kong and Macau"]}

Hasil Pelabelan mencakup informasi berikut:

{
    "option":["Passport", "ID card"]    # Label dari gambar.
}

Deteksi objek

# ID entri, data mentah, dan hasil pelabelan.
1,{"url": "http://b.jpg"},[{"text": "{\"class*\": \"Kategori 1\"}", "coord": ["306.73", "517.59", "324.42", "282.07", "347.69", "282.07", "333.73", "519.45"]}, {"text": "{\"class*\": \"Kategori 2\"}", "coord": ["342.11", "723.32", "349.56", "608.81", "366.31", "606.95", "360.73", "730.76"]}]
2,{"url": "http://a.jpg"},[{"text": "{\"class*\": \"Kategori 1\"}", "coord": ["338.35", "8.53", "700.16", "8.53", "700.16", "50.35", "338.35", "50.35"]}, {"text": "{\"class*\": \"Kategori 2\"}", "coord": ["26.88", "64.00", "218.03", "64.00", "218.03", "99.84", "26.88", "99.84"]}]"

Hasil Pelabelan mencakup informasi berikut:

[        # Daftar objek.
    {
        "text":"{\"class*\": \"Kategori 1\"}",    # String JSON yang menunjukkan kategori tempat objek termasuk.
        "coord":[    # Koordinat yang mengidentifikasi lokasi kotak pembatas yang digambar di sekitar objek.
            "338.35",
            "8.53",
            "700.16",
            "8.53",
            "700.16",
            "50.35",
            "338.35",
            "50.35"
        ]
    },
    {
        "text":"{\"class*\": \Kategori 2\"}",
        "coord":[
            "26.88",
            "64.00",
            "218.03",
            "64.00",
            "218.03",
            "99.84",
            "26.88",
            "99.84"
        ]
    }
]

Segmentasi gambar

Unduh File CSV Contoh.

# ID entri, data mentah, dan hasil pelabelan.
1,{"http://a.jpg"},{"ossUrl":"http://ossgw.alicdn.com/a.png"}

Hasil Pelabelan mencakup informasi berikut:

{
    "ossUrl":"http://ossgw.alicdn.com/a.png"
    # URL Object Storage Service (OSS) dari masker yang dihasilkan untuk gambar. Masker dalam format PNG. Gambar memiliki saluran merah, biru, dan hijau untuk menyimpan informasi. Saluran merah biasanya menyimpan informasi kategori gambar.
    # ID saluran dimulai dari 0. Nilai valid: 0 hingga 3. Nilai 0 menunjukkan latar belakang.
}

Pengenalan teks

# ID entri, data mentah, dan hasil pelabelan.
1,{"url": "http://b.jpg"},{"text": "Teks 1"}
2,{"url": "http://a.jpg"},{"text": "Teks 2"}

Hasil Pelabelan mencakup informasi berikut:

{
    "text":"Teks 1"# Teks yang dikenali.
}

Deteksi teks

# ID entri, data mentah, dan hasil pelabelan.
1,{"url": "http://b.jpg"},[[{"text": "{\"direction\": \"Bawah kanan\", \"class*\": \"Kategori 1\"}", "coord": ["306.73", "517.59", "324.42", "282.07", "347.69", "282.07", "333.73", "519.45"]}, {"text": "{\"direction\": \"Bawah kanan\", \"class*\": \"Kategori 2\"}", "coord": ["342.11", "723.32", "349.56", "608.81", "366.31", "606.95", "360.73", "730.76"]}], {"option": "Bawah kanan"}]
2,{"url": "http://a.jpg"},[[{"text": "{\"direction\": \"Bawah bawah\", \"class*\": \"Kategori 1\"}", "coord": ["338.35", "8.53", "700.16", "8.53", "700.16", "50.35", "338.35", "50.35"]}, {"text": "{\"direction\": \"Bawah bawah\", \"class*\": \"Kategori 2\"}", "coord": ["26.88", "64.00", "218.03", "64.00", "218.03", "99.84", "26.88", "99.84"]}], {"option": "Bawah bawah"}]

Hasil Pelabelan mencakup informasi berikut:

[        # Daftar baris teks.
    [
        {
            "text":"{\"direction\": \"Bawah bawah\", \"class*\": \"Kategori 1\"}",
                         # String JSON yang menunjukkan informasi tentang baris teks. Bidang direction menunjukkan orientasi baris teks, sedangkan bidang class* menunjukkan kategori teks.
            "coord":[ # Koordinat yang mengidentifikasi lokasi kotak pembatas yang digambar di sekitar baris teks.
                "338.35",
                "8.53",
                "700.16",
                "8.53",
                "700.16",
                "50.35",
                "338.35",
                "50.35"
            ]
        },
        {
            "text":"{\"direction\": \"Bawah bawah\", \"class*\": \"Kategori 2\"}",
            "coord":[
                "26.88",
                "64.00",
                "218.03",
                "64.00",
                "218.03",
                "99.84",
                "26.88",
                "99.84"
            ]
        }
    ],
    {
        "option":"Bawah bawah"    # Orientasi gambar.
    }
]

Orientasi gambar menentukan apakah bagian bawah gambar mengarah ke bawah, atas, kiri, atau kanan.

Pengenalan teks ujung ke ujung

# ID entri, data mentah, dan hasil pelabelan.
1,{"url": "http://b.jpg"},[[{"text": "{\"text\": \"Teks 1\", \"direction\": \"Bawah kanan\", \"class*\": \"Kategori 1\"}", "coord": ["306.73", "517.59", "324.42", "282.07", "347.69", "282.07", "333.73", "519.45"]}, {"text": "{\"text\": \"Teks 2\", \"direction\": \"Bawah kanan\", \"class*\": \"Kategori 2\"}", "coord": ["342.11", "723.32", "349.56", "608.81", "366.31", "606.95", "360.73", "730.76"]}], {"option": "Bawah kanan"}]
2,{"url": "http://a.jpg"},[[{"text": "{\"text\": \"Teks 3\", \"direction\": \"Bawah bawah\", \"class*\": \"Kategori 1\"}", "coord": ["338.35", "8.53", "700.16", "8.53", "700.16", "50.35", "338.35", "50.35"]}, {"text": "{\"text\": \"Teks 4\", \"direction\": \"Bawah bawah\", \"class*\": \"Kategori 2\"}", "coord": ["26.88", "64.00", "218.03", "64.00", "218.03", "99.84", "26.88", "99.84"]}], {"option": "Bawah bawah"}]

Hasil Pelabelan mencakup informasi berikut:

[        # Daftar baris teks.
    [
        {
            "text":"{\"text\": \"Teks 3\", "\"direction\": \"Bawah bawah\", \"class*\": \"Kategori 1\"}",
                         # String JSON yang menunjukkan informasi tentang baris teks. Bidang direction menunjukkan orientasi baris teks, sedangkan bidang class* menunjukkan kategori teks.                         
            "coord":[ # Koordinat yang mengidentifikasi lokasi kotak pembatas yang digambar di sekitar baris teks.
                "338.35",
                "8.53",
                "700.16",
                "8.53",
                "700.16",
                "50.35",
                "338.35",
                "50.35"
            ]
        },
        {
            "text":"{\"text\": \"Teks 4\", \"direction\": \"Bawah bawah\", \"class*\": \"Kategori 2\"}",
            "coord":[
                "26.88",
                "64.00",
                "218.03",
                "64.00",
                "218.03",
                "99.84",
                "26.88",
                "99.84"
            ]
        }
    ],
    {
        "option":"Bawah bawah"    # Orientasi gambar.
    }
]

Orientasi gambar menentukan apakah bagian bawah gambar mengarah ke bawah, atas, kiri, atau kanan.