全部产品
Search
文档中心

Content Moderation:Mengirimkan tugas OCR gambar sinkron

更新时间:Jun 28, 2025

Kirim tugas pengenalan karakter optik (OCR) dan dapatkan hasil OCR secara real-time. Operasi ini digunakan untuk mendeteksi dan mengekstrak teks dari gambar.

Deskripsi

Operasi: /green/image/scan

Gunakan operasi ini untuk mengirimkan tugas OCR dan mendapatkan hasil secara real-time. Untuk detail tentang cara membuat permintaan HTTP, lihat Struktur Permintaan. Anda juga dapat menggunakan permintaan HTTP yang sudah ada. Untuk informasi lebih lanjut, lihat Gambaran SDK.

  • Billing method:

    Anda akan dikenakan biaya saat memanggil operasi ini. Untuk informasi lebih lanjut tentang metode penagihan, lihat

  • Response timeout:

    Waktu tanggapan maksimum untuk permintaan moderasi sinkron adalah 6 detik. Jika moderasi tidak selesai dalam waktu tersebut, kesalahan timeout akan dikembalikan. Jika hasil real-time tidak diperlukan, gunakan permintaan moderasi asinkron. Moderasi sinkron direkomendasikan karena lebih mudah dipanggil, dengan periode timeout disarankan selama 6 detik.

  • Returned results:

    Hasil moderasi umumnya dikembalikan dalam waktu 1 detik setelah permintaan sinkron dikirim. Waktu ini dapat meningkat pada skenario khusus, seperti pemrosesan banyak permintaan, ukuran gambar besar, atau gambar dengan banyak teks. Kecepatan OCR berbanding terbalik dengan jumlah kata dalam gambar. Untuk gambar dengan banyak teks, kami merekomendasikan penggunaan permintaan moderasi asinkron.

  • Limits on images:

    • URL gambar harus dalam format HTTP atau HTTPS.

    • Format gambar yang didukung adalah PNG, JPG, JPEG, BMP, GIF, atau WEBP.

    • Ukuran maksimal gambar adalah 20 MB. Batas ini berlaku untuk operasi moderasi sinkron dan asinkron.

    • Durasi pengunduhan gambar dibatasi hingga 3 detik. Jika gambar gagal diunduh dalam waktu tersebut, kesalahan timeout akan dikembalikan.

    • Kami merekomendasikan penggunaan gambar minimal 256 × 256 piksel untuk memastikan efektivitas moderasi.

    • Waktu tanggapan operasi bergantung pada durasi pengunduhan gambar. Pastikan Anda menggunakan layanan penyimpanan yang stabil dan andal, seperti Object Storage Service (OSS) atau Content Delivery Network (CDN).

Batasan QPS

Setiap akun dapat memanggil operasi ini hingga 10 kali per detik. Jika batas ini dilampaui, throttling akan dipicu, yang dapat memengaruhi bisnis Anda. Perhatikan batas ini saat memanggil operasi.

Parameter Permintaan

Parameter

Tipe

Wajib

Contoh

Deskripsi

bizType

String

Tidak

default

Skenario bisnis. Anda dapat membuat skenario bisnis di

Content Moderation console. Untuk informasi lebih lanjut, lihat Sesuaikan kebijakan untuk moderasi berbantuan mesin.

scenes

StringArray

Ya

["ocr"]

Skenario moderasi. Atur nilainya menjadi ocr.

tasks

JSONArray

Ya

Daftar objek yang ingin Anda moderasi. Array JSON dapat berisi satu atau lebih elemen. Setiap elemen adalah struktur. Array JSON dapat berisi hingga 100 elemen. Dengan kata lain, Anda dapat mengirimkan hingga 100 objek moderasi sekaligus. Untuk mengirimkan 100 objek moderasi sekaligus, Anda harus menaikkan batas konkurensi terkait menjadi angka lebih dari 100. Untuk informasi lebih lanjut tentang struktur, lihat task.

Tabel 1. task

Parameter

Tipe

Wajib

Contoh

Deskripsi

dataId

String

Tidak

test_data_xxxx

ID data. Pastikan setiap ID unik dalam permintaan.

url

String

Ya

https://aliyundoc.com/test_image_xxxx.png

URL HTTP atau HTTPS yang dapat diakses melalui Internet. URL memiliki panjang hingga 2.048 karakter.

interval

Integer

Tidak

2

Interval antara dua frame yang ditangkap secara berturut-turut. Parameter ini khusus untuk moderasi gambar GIF atau panjang.

  • Gambar GIF dapat dianggap sebagai array frame. Satu frame ditangkap untuk moderasi dari setiap n frame, di mana n ditentukan oleh parameter interval. Sistem hanya menangkap frame dari gambar GIF ketika parameter ini ditentukan.

  • Gambar panjang dapat berupa mode potret atau horizontal.

    • Untuk memoderasi gambar potret panjang, Anda dapat menghitung jumlah total frame dengan cara berikut: bagi tinggi dengan lebar dan bulatkan hasilnya ke bilangan bulat terdekat. Dalam gambar potret panjang, tinggi lebih dari 400 piksel, dan rasio tinggi terhadap lebar lebih dari 2,5:1.

    • Untuk memoderasi gambar horizontal panjang, Anda dapat menghitung jumlah total frame dengan cara berikut: bagi lebar dengan tinggi dan bulatkan hasilnya ke bilangan bulat terdekat. Dalam gambar horizontal panjang, lebar lebih dari 400 piksel, dan rasio lebar terhadap tinggi lebih dari 2,5:1.

Secara default, hanya frame pertama dari gambar GIF atau gambar panjang yang dimoderasi. Anda dapat menggunakan parameter interval untuk menentukan interval antara dua frame yang ditangkap secara berturut-turut. Ini membantu mengurangi biaya moderasi.

Catatan

Parameter interval dan maxFrames harus digunakan berpasangan. Misalnya, parameter interval diatur ke 2, dan parameter maxFrames diatur ke 100 untuk memoderasi gambar GIF atau gambar panjang. Dalam contoh ini, satu dari setiap dua frame dimoderasi, dan maksimal 100 frame dimoderasi. Biaya dihitung berdasarkan jumlah frame yang sebenarnya dimoderasi.

maxFrames

Integer

Tidak

100

Jumlah maksimum frame yang akan ditangkap. Parameter ini khusus untuk moderasi gambar GIF atau panjang. Nilai default: 1.

Jika nilai parameter interval dikalikan dengan nilai parameter maxFrames lebih kecil dari jumlah total frame dalam gambar GIF atau gambar panjang, interval untuk menangkap frame secara otomatis diubah menjadi bilangan bulat yang dibulatkan ke atas dari hasil pembagian jumlah total frame dalam gambar dengan nilai parameter maxFrames. Ini membantu meningkatkan efek moderasi keseluruhan.

Parameter Respons

Parameter

Tipe

Contoh

Deskripsi

code

Integer

200

Kode status HTTP yang dikembalikan.

msg

String

OK

Pesan yang dikembalikan untuk permintaan.

dataId

String

test_data_xxxx

ID objek moderasi.

Catatan

Jika Anda menyetel parameter dataId dalam permintaan moderasi, nilai parameter permintaan dataId dikembalikan di sini.

taskId

String

img5A@k7a@B4q@6K@d9nfKgOs-1s****

ID tugas moderasi.

url

String

https://aliyundoc.com/test_image_xxxx.png

URL HTTP atau HTTPS yang dapat diakses melalui Internet. URL memiliki panjang hingga 2.048 karakter.

results

Array

Hasil yang dikembalikan. Jika kode status HTTP 200 dikembalikan, array dalam hasil yang dikembalikan berisi satu atau lebih elemen. Setiap elemen adalah struktur. Untuk informasi lebih lanjut tentang struktur setiap elemen, lihat result.

Tabel 2. result

Parameter

Tipe

Contoh

Deskripsi

scene

String

ocr

Skenario moderasi. Atur nilainya menjadi ocr.

label

String

ocr

Kategori hasil moderasi. Nilai yang valid:

  • normal: Gambar tidak mengandung teks.

  • ocr: Gambar mengandung teks.

suggestion

String

review

Rekomendasi tindakan lanjutan. Nilai yang valid:

  • pass: Gambar tidak memerlukan tindakan lebih lanjut.

  • review: Gambar memerlukan tinjauan manual.

rate

Float

99.91

Probabilitas bahwa gambar yang dimoderasi termasuk dalam kategori terdeteksi. Anda dapat mengabaikan parameter ini dalam skenario OCR.

ocrLocations

Array

Informasi tentang entri teks tunggal dalam gambar statis yang dimoderasi, yang mencakup teks, ukuran teks, dan lokasi teks. Untuk informasi lebih lanjut tentang struktur, lihat ocrLocation.

Catatan

Jika tidak ada teks yang terdeteksi dalam gambar yang dimoderasi, parameter ini tidak dikembalikan.

ocrData

Array

["hello, this is a test text."]

Kombinasi semua teks dalam gambar statis yang dimoderasi. Secara umum, kombinasi teks disimpan sebagai elemen pertama dari array.

Catatan

Jika tidak ada teks yang terdeteksi dalam gambar yang dimoderasi, parameter ini tidak dikembalikan.

frames

Array

xxx

Frame yang ditangkap dari gambar animasi yang dimoderasi dan teks yang terdeteksi di setiap frame.

Catatan

Jika tidak lebih dari satu frame yang ditangkap, parameter ini tidak dikembalikan.

Tabel 1. ocrLocation
ParameterTipeContohDeskripsi
textStringhelloEntri teks tunggal yang terdeteksi dalam gambar yang dimoderasi.
xFloat41Jarak antara sudut kiri atas area teks dan sumbu y, dengan sudut kiri atas gambar sebagai titik asal koordinat. Satuan: piksel.
yFloat84Jarak antara sudut kiri atas area teks dan sumbu x, dengan sudut kiri atas gambar sebagai titik asal koordinat. Satuan: piksel.
wFloat83Lebar area teks. Satuan: piksel.
hFloat26Tinggi area teks. Satuan: piksel.

Tabel 3. ocrDetailInfo

Tabel 4. wordsInfo

Contoh

Contoh Permintaan

http(s)://[Endpoint]/green/image/scan
&<Parameter Permintaan Umum>
{
    "scenes": [
        "ocr"
    ],
    "tasks": [
        {
            "dataId": "test_data_xxxx",
            "url": "https://aliyundoc.com/test_image_xxxx.png"
        }
    ]
}

Contoh Tanggapan Sukses

{
    "code": 200,
    "data": [
        {
            "code": 200,
            "dataId": "test_data_xxxx",
            "extras": {

            },
            "msg": "OK",
            "results": [
                {
                    "label": "ocr",
                    "ocrData": [
                        "hello, this is a test text."
                    ],
                    "ocrLocations": [
                        {
                            "h": 26,
                            "text": "hello",
                            "w": 83,
                            "x": 41,
                            "y": 84
                        },
                        {
                            "h": 25,
                            "text": " this is a test text.",
                            "w": 95,
                            "x": 78,
                            "y": 114
                        }
                    ],
                    "rate": 99.91,
                    "scene: "ocr",
                    "suggestion": "review"
                }
            ],
            "taskId": "img5A@k7a@B4q@6K@d9nfKgOs-1s****",
            "url": "https://aliyundoc.com/test_image_xxxx.png"
        }
    ],
    "msg": "OK",
    "requestId": "C4AB08A9-AD75-4410-859B-0B9EF6DFC3C4"
}