全部产品
Search
文档中心

Content Moderation:Audio Moderation 2.0 layanan multibahasa

更新时间:Nov 10, 2025

Audio Moderation 2.0 dilengkapi model audio yang ditingkatkan untuk mendukung konten audio dalam bahasa Tiongkok, Inggris, dan campuran Tiongkok-Inggris. Layanan ini menyediakan kebijakan moderasi dan sistem tag yang disesuaikan bagi bisnis internasional. Topik ini menjelaskan fitur dan penggunaan layanan multibahasa Audio Moderation 2.0.

Fitur

Dibandingkan dengan Audio Moderation 1.0, Audio Moderation 2.0 menerapkan kebijakan dan sistem tag terpisah guna memenuhi kebutuhan bisnis internasional. Layanan ini juga menawarkan lebih banyak fitur untuk menyederhanakan penggunaan dan mendukung tinjauan manual.

Item perbandingan

Audio Moderation 2.0

Audio Moderation 1.0

Kemampuan multibahasa

  • Wilayah Singapura mendukung 35 bahasa, termasuk Tiongkok, Inggris, Arab, Jerman, Rusia, Prancis, Korea, Jepang, Spanyol, Italia, Indonesia, Vietnam, Melayu, Thailand, Hindi, Türkiye, Portugis, Belanda, Polandia, Bengali, Persia, Swedia, Denmark, Norwegia, Islandia, Finlandia, Belarusia, Lituania, Ceko, Slowakia, Hongaria, Yunani, dan Rumania.

  • Wilayah AS (Virginia) mendukung bahasa Tiongkok, Inggris, dan campuran Tiongkok-Inggris.

Hanya mendukung bahasa Tiongkok secara default.

Kemampuan moderasi

  • Menggunakan beberapa model paralel dengan fitur khusus bahasa dan wilayah untuk kebijakan yang lebih tepat.

  • Termasuk model tambahan seperti model deteksi erangan untuk mengidentifikasi fitur non-semantik.

  • Menggunakan satu model dengan fitur khusus bahasa untuk menyeimbangkan akurasi dan recall.

  • Tidak mendukung model deteksi erangan secara default.

Sistem tag

Menggunakan sistem tag internasional dengan tag seperti profanity dan regional. Sistem ini mendukung beberapa tag risiko dan sub-tag.

Menggunakan sistem tag yang dirancang untuk hanya mendukung satu tag risiko.

Fitur API

  • Menggunakan solusi segmentasi yang dapat disesuaikan di mana audio dibagi menjadi klip dengan panjang tetap. Segmen berdurasi tetap meningkatkan efisiensi tinjauan manual.

  • Mengembalikan seluruh konten segmen audio dan teks transkripsi. Menyediakan URL sementara untuk segmen audio guna membantu tinjauan manual.

  • Menggunakan solusi segmentasi berbasis kalimat semantik di mana segmen audio berkisar dari beberapa detik hingga puluhan detik.

  • Hanya mengembalikan segmen audio yang berpotensi melanggar. Tidak menyediakan URL sementara untuk segmen audio secara default.

Tag terinternasionalkan

Layanan multibahasa Audio Moderation 2.0 menggunakan sistem tag internasional. Jika konten mengandung berbagai jenis risiko, layanan dapat mengembalikan beberapa tag secara bersamaan. Kategorisasi tag mencakup namun tidak terbatas pada hal-hal berikut:

Jenis tag

Kategorisasi

Tag utama (label)

  • violence: Kekerasan

  • contraband: Barang Terlarang

  • Sexual Content: Pornografi

  • profanity: Kata Kasar

  • pullinTraffic: Trafik berbasis iklan

  • regional: Konflik regional

  • C_customized: Terdeteksi di pustaka yang ditentukan pengguna

Sub-tag (riskTips)

Sub-tag dikembalikan dalam format xxx_yyy. Contohnya: contraband_Drugs.

Kinerja layanan

Audio Moderation 2.0 menggunakan mesin inti berkinerja tinggi yang mampu menjadwalkan puluhan model dan kebijakan secara konkuren tinggi untuk memastikan layanan tepat waktu.

Kinerja layanan

Deskripsi

Ukuran file

Versi 2.0 meningkatkan ukuran maksimum file audio yang didukung dari 200 MB menjadi 500 MB.

Format file audio

Format file audio yang didukung: MP3, WAV, AAC, WMA, OGG, M4A, dan AMR.

Format file video yang didukung: AVI, FLV, MP4, MPG, ASF, WMV, MOV, RMVB, dan RM.

Aliran audio langsung

Protokol yang didukung: RTMP, HLS, HTTP-FLV, dan RTSP.

Permintaan per detik (QPS)

Permintaan per detik (QPS) untuk mengirimkan tugas ditingkatkan dari 50 menjadi 100.

Aliran konkuren

Versi 2.0 meningkatkan batas default aliran konkuren dari 20 menjadi 50.

Catatan

Dalam moderasi audio, QPS mengacu pada jumlah permintaan yang direspons oleh API per detik. Aliran konkuren mengacu pada jumlah file audio atau aliran audio yang sedang dideteksi di sistem secara bersamaan.

Informasi penagihan

Layanan Audio Moderation 2.0 mendukung metode penagihan bayar sesuai penggunaan.

Bayar sesuai penggunaan

Setelah Anda mengaktifkan layanan Audio Moderation 2.0, metode penagihan default adalah bayar sesuai penggunaan. Anda ditagih harian berdasarkan penggunaan aktual Anda. Jika Anda tidak menggunakan layanan, Anda tidak dikenai biaya.

Jenis moderasi

Skema bisnis yang didukung (layanan)

Harga satuan

Audio Moderation Standar (audio_standard)

  • Deteksi multibahasa untuk media audio dan video: audio_multilingual_global

  • Deteksi multibahasa untuk siaran langsung sosial dan hiburan: stream_multilingual_global

USD 9,0 per 1.000 menit

Panduan akses

Langkah 1: Aktifkan layanan

Buka Aktifkan Layanan untuk mengaktifkan layanan Audio Moderation 2.0.

Langkah 2: Berikan izin kepada Pengguna RAM

Sebelum menggunakan kit pengembangan perangkat lunak (SDK) atau API, berikan izin kepada Pengguna RAM. Anda dapat membuat Pasangan Kunci Akses untuk Akun Alibaba Cloud Anda atau Pengguna RAM. Anda harus menggunakan Pasangan Kunci Akses tersebut untuk verifikasi identitas saat memanggil Operasi API Alibaba Cloud. Untuk informasi lebih lanjut, lihat Dapatkan Pasangan Kunci Akses.

Prosedur

  1. Masuk ke Konsol RAM sebagai administrator RAM.

  2. Buat Pengguna RAM.

    Untuk informasi lebih lanjut, lihat Buat Pengguna RAM.

  3. Berikan kebijakan sistem AliyunYundunGreenWebFullAccess kepada Pengguna RAM.

    Untuk informasi lebih lanjut, lihat Berikan izin kepada Pengguna RAM.

    Setelah menyelesaikan langkah-langkah di atas, Anda dapat memanggil API Content Moderation sebagai Pengguna RAM.

Langkah 3: Instal dan integrasikan SDK

Wilayah berikut didukung:

Wilayah

Titik akhir Internet

Titik akhir internal

Singapura

https://green-cip.ap-southeast-1.aliyuncs.com

https://green-cip-vpc.ap-southeast-1.aliyuncs.com

AS (Virginia)

https://green-cip.us-east-1.aliyuncs.com

https://green-cip-vpc.us-east-1.aliyuncs.com

Catatan

Jika Anda memerlukan contoh kode SDK dalam bahasa lain, Anda dapat menggunakan alat debugging daring di Portal Pengembang OpenAPI untuk melakukan debugging Operasi API. Alat ini secara otomatis menghasilkan contoh kode SDK untuk Operasi API tersebut.

API

Catatan penggunaan

Titik akhir layanan: https://green-cip.{region}.aliyuncs.com.

Anda dapat memanggil operasi ini untuk membuat tugas moderasi konten audio. Anda dapat menyusun permintaan HTTP secara manual atau menggunakan SDK. Untuk informasi tentang cara menyusun permintaan HTTP manual, lihat Lakukan panggilan HTTP mentah. Untuk informasi lebih lanjut tentang SDK, lihat SDK dan panduan integrasi Audio Moderation 2.0.

  • API Operations:

    • Kirimkan tugas moderasi: VoiceModeration

    • Kueri hasil tugas moderasi: VoiceModerationResult

  • Billing:

    Ini adalah operasi berbayar. Anda hanya dikenai biaya untuk permintaan yang mengembalikan kode status HTTP 200. Permintaan yang mengembalikan kode kesalahan lainnya tidak dikenai biaya.

Kirimkan tugas moderasi

Parameter permintaan

Nama

Tipe

Wajib

Contoh

Deskripsi

Service

String

Ya

udio_multilingual_global

Jenis layanan moderasi. Nilai yang valid:

  • audio_multilingual_global: Deteksi multibahasa untuk media audio dan video

  • stream_multilingual_global: Deteksi multibahasa untuk siaran langsung sosial dan hiburan

ServiceParameters

JSONString

Ya

Kumpulan parameter yang diperlukan oleh layanan moderasi. Ini adalah string JSON. Untuk deskripsi setiap string, lihat ServiceParameters.

Tabel 1. ServiceParameters

Nama

Tipe

Wajib

Contoh

Deskripsi

url

String

Ya

http://aliyundoc.com/test.flv

URL objek yang akan dideteksi. Harus berupa URL HTTP atau HTTPS publik.

callback

String

Tidak

http://aliyundoc.com

URL tempat hasil moderasi dikirim sebagai notifikasi callback. HTTP dan HTTPS didukung. Jika Anda mengosongkan bidang ini, Anda harus melakukan polling secara berkala untuk mendapatkan hasil moderasi.

Antarmuka callback harus mendukung metode POST, data berkode UTF-8, dan parameter form checksum dan content.

Content Moderation menetapkan parameter checksum dan content serta memanggil antarmuka callback Anda untuk mengembalikan hasil moderasi sesuai aturan dan format berikut.

  • checksum: String yang dihasilkan dengan menggabungkan UID pengguna + seed + content lalu menerapkan algoritma SHA256. UID pengguna adalah ID akun Alibaba Cloud Anda, yang dapat Anda temukan di Konsol Manajemen Alibaba Cloud. Untuk proteksi anti-pemalsuan, Anda dapat menghasilkan string menggunakan algoritma yang sama saat menerima hasil yang didorong dan memverifikasinya terhadap checksum.

    Catatan

    UID pengguna harus merupakan UID akun Alibaba Cloud Anda, bukan UID Pengguna RAM.

  • content: String JSON. Uraikan menjadi objek JSON. Untuk contoh hasil content, lihat tanggapan contoh untuk mengkueri hasil moderasi.

Catatan

Setelah antarmuka callback server Anda menerima hasil yang didorong oleh Content Moderation, jika mengembalikan kode status HTTP 200, penerimaan berhasil. Kode status HTTP lainnya dianggap gagal. Jika gagal, Content Moderation akan mencoba mendorong ulang hasil hingga 16 kali sampai berhasil diterima. Jika masih belum diterima setelah 16 kali percobaan, dorongan dihentikan. Periksa status antarmuka callback Anda.

seed

String

Tidak

abc****

String acak yang digunakan untuk tanda tangan dalam permintaan notifikasi callback.

Dapat berisi huruf, angka, dan garis bawah (_), serta tidak boleh melebihi 64 karakter. Anda dapat menyesuaikan nilai ini untuk memverifikasi bahwa permintaan notifikasi callback diprakarsai oleh layanan Content Moderation Alibaba Cloud.

Catatan

Bidang ini wajib diisi saat menggunakan callback.

cryptType

String

Tidak

SHA256

Saat menggunakan notifikasi callback (callback), ini menetapkan algoritma enkripsi untuk konten notifikasi. Content Moderation mengenkripsi hasil (string yang digabung dari UID pengguna + seed + content) menggunakan algoritma yang Anda tentukan sebelum mengirimkannya ke alamat notifikasi callback Anda. Nilai yang valid:

  • SHA256 (default): Menggunakan algoritma enkripsi SHA256.

  • SM3: Menggunakan algoritma HMAC SM3. Mengembalikan string heksadesimal berupa huruf kecil dan angka. Misalnya, `abc` yang dienkripsi dengan SM3 menghasilkan `66c7f0f462eeedd9d1f2d46bdc10e4e24167c4875cf2f7a2297da02b8f4ba8e0`.

liveId

String

Tidak

liveId1****

ID aliran audio langsung.

Parameter ini digunakan untuk menghapus duplikat tugas aliran audio langsung dan mencegah moderasi berulang. Jika Anda mengirimkan parameter ini, sistem akan memeriksa apakah ada tugas moderasi yang sedang berlangsung berdasarkan uid+service+liveId. Jika tugas sudah ada, sistem akan mengembalikan taskId moderasi langsung yang sudah ada alih-alih memulai yang baru.

dataId

String

Tidak

voice20240307***

ID data yang sesuai dengan objek yang terdeteksi.

ID tersebut dapat terdiri atas huruf besar dan kecil, angka, garis bawah (_), tanda hubung (-), dan titik (.), serta tidak boleh melebihi 64 karakter. Anda dapat menggunakannya untuk mengidentifikasi data bisnis Anda secara unik.

Parameter kembali

Nama

Tipe

Contoh

Deskripsi

Code

Integer

200

Kode kesalahan. Ini konsisten dengan kode status HTTP. Untuk informasi lebih lanjut, lihat Deskripsi kode.

Data

JSONObject

{"taskId": "AAAAA-BBBBB"}

Data hasil moderasi.

Message

String

OK

Pesan tanggapan untuk permintaan.

RequestId

String

AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****

ID permintaan.

Contoh

Contoh permintaan

{
  "service":"audio_multilingual_global",
  "serviceParameters":"{\"cryptType\":\"SHA256\",\"seed\":\"abc***123\",\"callback\":\"https://aliyun.com/callback\",\"url\":\"http://aliyundoc.com/test.flv"}"
}

Contoh respons

{
  "code":200,
  "data":{
    "taskId":"AAAAA-BBBBB"
  },
  "message":"SUCCESS",
  "requestId":"AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}

Kueri hasil tugas

Setelah tugas moderasi selesai, hasil kueri mengembalikan data untuk semua segmen audio.

Parameter permintaan

Nama

Tipe

Wajib

Contoh

Deskripsi

Service

String

Ya

audio_multilingual_global

Jenis layanan moderasi.

ServiceParameters

JSONString

Ya

Kumpulan parameter yang diperlukan oleh layanan moderasi. Ini adalah string JSON. Untuk deskripsi setiap string, lihat ServiceParameters.

Tabel 2. ServiceParameters

Nama

Tipe

Wajib

Contoh

Deskripsi

taskId

String

Ya

AAAAA-BBBBB

ID yang dikembalikan saat tugas dikirimkan.

Parameter respons

Nama

Tipe

Contoh

Deskripsi

Code

Integer

200

Kode kesalahan. Ini konsisten dengan kode status HTTP. Untuk informasi lebih lanjut, lihat Deskripsi kode.

Data

JSONObject

{"url":xxxx,"results":xxx}

Parameter yang dikembalikan dalam format JSON.

Message

String

OK

Pesan tanggapan untuk permintaan.

RequestId

String

AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****

ID permintaan.

Tabel 3. Data

Nama

Tipe

Contoh

Deskripsi

url

String

https://aliyundoc.com

URL objek yang dideteksi.

LiveId

String

liveId1****

ID aliran audio langsung (opsional).

DataId

String

voice20240307***

Data ID yang sesuai dengan objek yang dideteksi (opsional).

RiskLevel

String

high

Tingkat risiko audio, dihitung berdasarkan semua segmen audio. Nilai yang dikembalikan meliputi:

  • high: Risiko tinggi

  • medium: Risiko menengah

  • low: Risiko rendah

  • none: Tidak ada risiko terdeteksi

Catatan

Konten berisiko tinggi harus ditangani langsung. Konten berisiko menengah harus ditinjau secara manual. Konten berisiko rendah hanya perlu ditangani jika recall tinggi diperlukan. Jika tidak, perlakukan sama seperti konten tanpa risiko terdeteksi.

sliceDetails

JSONArray

Hasil detail untuk segmen audio. Untuk informasi lebih lanjut, lihat sliceDetails.

Tabel 4. sliceDetails

Nama

Tipe

Contoh

Deskripsi

startTime

Integer

0

Waktu mulai kalimat, dalam detik.

endTime

Integer

4065

Waktu akhir kalimat, dalam detik.

startTimestamp

Integer

1678854649720

Timestamp awal segmen, dalam milidetik.

endTimestamp

Integer

1678854649720

Timestamp akhir segmen, dalam milidetik.

text

String

disgusting

Teks yang dikonversi dari audio.

url

String

https://aliyundoc.com

URL sementara untuk segmen audio. URL berlaku selama 30 menit. Simpan segera.

labels

String

pullinTraffic

Tag, dipisahkan dengan koma (,). Meliputi:

  • Violence: Terorisme

  • contraband: Barang Terlarang

  • Sexual content: Pornografi

  • profanity: Kata Kasar

  • pullinTraffic: Trafik berbasis iklan

  • regional: Konflik regional

  • C_customized: Terdeteksi di pustaka yang ditentukan pengguna

RiskLevel

String

high

Tingkat risiko segmen audio. Nilai yang dikembalikan meliputi:

  • high: Risiko tinggi

  • medium: Risiko menengah

  • low: Risiko rendah

  • none: Tidak ada risiko terdeteksi

riskWords

String

AAA,BBB,CCC

Kata-kata berisiko yang terdeteksi, dipisahkan dengan koma.

riskTips

String

sexuality_Suggestive

Sub-tag, dipisahkan dengan koma.

extend

String

{\"riskTips\":\"sexuality_Suggestive\",\"riskWords\":\"pxxxxy\"}

Bidang cadangan.

Contoh

Contoh permintaan

{
  "service":"audio_multilingual_global",
  "serviceParameters":"{\"taskId\":\"AAAAA-BBBBB"}"
}

Contoh respons

{
    "Code": 200,
    "Data": {
        "DataId": "voice20240307***",
        "LiveId": "liveId1****",
        "RiskLevel": "high",
        "SliceDetails": [
            {
                "EndTime": 4065,
                "Labels": "political_content,xxxx",
                "RiskLevel": "high",
                "RiskTips": "contraband_ProhibitedGoods",
                "RiskWords": "Risk Word A",
                "StartTime": 0,
                "Text": "Content Moderation product test case",
                "Url": "https://aliyundoc.com"
            }
        ]
    },
    "Message": "OK",
    "RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}

Format pesan callback

Data pesan callback dalam format JSON, seperti di bawah ini:

Nama bidang

Tipe bidang

Deskripsi

checksum

String

Checksum. String yang dihasilkan dengan menggabungkan uid pengguna + seed + content lalu menerapkan algoritma SHA256.

UID pengguna adalah ID akun Alibaba Cloud Anda, yang dapat Anda temukan di Konsol Manajemen Alibaba Cloud. Untuk proteksi anti-pemalsuan, Anda dapat menghasilkan string menggunakan algoritma yang sama saat menerima hasil yang didorong dan memverifikasinya terhadap checksum.

Catatan

UID pengguna harus merupakan UID akun Alibaba Cloud Anda, bukan UID Pengguna RAM.

taskId

String

ID tugas pesan callback.

content

String

Hasil moderasi yang diserialisasi. Ini adalah string JSON. Uraikan menjadi objek JSON. Format hasil content sama dengan respons untuk mengkueri hasil tugas. Untuk informasi lebih lanjut, lihat Parameter respons.

Deskripsi kode

Berikut adalah deskripsi kode yang dikembalikan oleh operasi. Biaya hanya dikenakan untuk permintaan yang mengembalikan kode 200.

Kode

Deskripsi

200

Permintaan berhasil.

280

Sedang diverifikasi.

400

Parameter permintaan kosong.

401

Parameter permintaan tidak valid.

402

Panjang parameter permintaan tidak memenuhi persyaratan. Periksa dan ubah parameter.

403

Permintaan melebihi batas QPS. Periksa dan sesuaikan batas QPS.

404

Terjadi kesalahan saat mengunduh file yang ditentukan. Periksa file atau coba lagi.

405

Pengunduhan file yang ditentukan habis waktu. File mungkin tidak dapat diakses. Periksa file dan coba lagi.

406

File yang ditentukan melebihi batas ukuran. Periksa file dan coba lagi.

407

Format file yang ditentukan tidak didukung. Periksa file dan coba lagi.

408

Akun tidak memiliki izin untuk memanggil operasi ini. Akun mungkin belum mengaktifkan layanan, memiliki pembayaran tertunda, atau tidak diizinkan mengakses layanan.

480

Jumlah aliran konkuren melebihi batas. Periksa dan sesuaikan konkurensi.

500

Terjadi kesalahan sistem.