Cara menggunakan layanan multibahasa Audio Moderation 2.0 - Content Moderation

Audio Moderation 2.0 dilengkapi model audio yang ditingkatkan untuk mendukung konten audio dalam bahasa Tiongkok, Inggris, dan campuran Tiongkok-Inggris. Layanan ini menyediakan kebijakan moderasi dan sistem tag yang disesuaikan bagi bisnis internasional. Topik ini menjelaskan fitur dan penggunaan layanan multibahasa Audio Moderation 2.0.

Fitur

Dibandingkan dengan Audio Moderation 1.0, Audio Moderation 2.0 menerapkan kebijakan dan sistem tag terpisah guna memenuhi kebutuhan bisnis internasional. Layanan ini juga menawarkan lebih banyak fitur untuk menyederhanakan penggunaan dan mendukung tinjauan manual.

Item perbandingan	Audio Moderation 2.0	Audio Moderation 1.0
Kemampuan multibahasa	Wilayah Singapura mendukung 35 bahasa, termasuk Tiongkok, Inggris, Arab, Jerman, Rusia, Prancis, Korea, Jepang, Spanyol, Italia, Indonesia, Vietnam, Melayu, Thailand, Hindi, Türkiye, Portugis, Belanda, Polandia, Bengali, Persia, Swedia, Denmark, Norwegia, Islandia, Finlandia, Belarusia, Lituania, Ceko, Slowakia, Hongaria, Yunani, dan Rumania. Wilayah AS (Virginia) mendukung bahasa Tiongkok, Inggris, dan campuran Tiongkok-Inggris.	Hanya mendukung bahasa Tiongkok secara default.
Kemampuan moderasi	Menggunakan beberapa model paralel dengan fitur khusus bahasa dan wilayah untuk kebijakan yang lebih tepat. Termasuk model tambahan seperti model deteksi erangan untuk mengidentifikasi fitur non-semantik.	Menggunakan satu model dengan fitur khusus bahasa untuk menyeimbangkan akurasi dan recall. Tidak mendukung model deteksi erangan secara default.
Sistem tag	Menggunakan sistem tag internasional dengan tag seperti profanity dan regional. Sistem ini mendukung beberapa tag risiko dan sub-tag.	Menggunakan sistem tag yang dirancang untuk hanya mendukung satu tag risiko.
Fitur API	Menggunakan solusi segmentasi yang dapat disesuaikan di mana audio dibagi menjadi klip dengan panjang tetap. Segmen berdurasi tetap meningkatkan efisiensi tinjauan manual. Mengembalikan seluruh konten segmen audio dan teks transkripsi. Menyediakan URL sementara untuk segmen audio guna membantu tinjauan manual.	Menggunakan solusi segmentasi berbasis kalimat semantik di mana segmen audio berkisar dari beberapa detik hingga puluhan detik. Hanya mengembalikan segmen audio yang berpotensi melanggar. Tidak menyediakan URL sementara untuk segmen audio secara default.

Tag terinternasionalkan

Layanan multibahasa Audio Moderation 2.0 menggunakan sistem tag internasional. Jika konten mengandung berbagai jenis risiko, layanan dapat mengembalikan beberapa tag secara bersamaan. Kategorisasi tag mencakup namun tidak terbatas pada hal-hal berikut:

Jenis tag	Kategorisasi
Tag utama (label)	violence: Kekerasan contraband: Barang Terlarang Sexual Content: Pornografi profanity: Kata Kasar pullinTraffic: Trafik berbasis iklan regional: Konflik regional C_customized: Terdeteksi di pustaka yang ditentukan pengguna
Sub-tag (riskTips)	Sub-tag dikembalikan dalam format `xxx_yyy`. Contohnya: `contraband_Drugs`.

Kinerja layanan

Audio Moderation 2.0 menggunakan mesin inti berkinerja tinggi yang mampu menjadwalkan puluhan model dan kebijakan secara konkuren tinggi untuk memastikan layanan tepat waktu.

Kinerja layanan	Deskripsi
Ukuran file	Versi 2.0 meningkatkan ukuran maksimum file audio yang didukung dari 200 MB menjadi 500 MB.
Format file audio	Format file audio yang didukung: MP3, WAV, AAC, WMA, OGG, M4A, dan AMR. Format file video yang didukung: AVI, FLV, MP4, MPG, ASF, WMV, MOV, RMVB, dan RM.
Aliran audio langsung	Protokol yang didukung: RTMP, HLS, HTTP-FLV, dan RTSP.
Permintaan per detik (QPS)	Permintaan per detik (QPS) untuk mengirimkan tugas ditingkatkan dari 50 menjadi 100.
Aliran konkuren	Versi 2.0 meningkatkan batas default aliran konkuren dari 20 menjadi 50.

Catatan

Dalam moderasi audio, QPS mengacu pada jumlah permintaan yang direspons oleh API per detik. Aliran konkuren mengacu pada jumlah file audio atau aliran audio yang sedang dideteksi di sistem secara bersamaan.

Informasi penagihan

Layanan Audio Moderation 2.0 mendukung metode penagihan bayar sesuai penggunaan.

Bayar sesuai penggunaan

Setelah Anda mengaktifkan layanan Audio Moderation 2.0, metode penagihan default adalah bayar sesuai penggunaan. Anda ditagih harian berdasarkan penggunaan aktual Anda. Jika Anda tidak menggunakan layanan, Anda tidak dikenai biaya.

Jenis moderasi	Skema bisnis yang didukung (layanan)	Harga satuan
Audio Moderation Standar (audio_standard)	Deteksi multibahasa untuk media audio dan video: audio_multilingual_global Deteksi multibahasa untuk siaran langsung sosial dan hiburan: stream_multilingual_global	USD 9,0 per 1.000 menit

Panduan akses

Langkah 1: Aktifkan layanan

Buka Aktifkan Layanan untuk mengaktifkan layanan Audio Moderation 2.0.

Langkah 2: Berikan izin kepada Pengguna RAM

Sebelum menggunakan kit pengembangan perangkat lunak (SDK) atau API, berikan izin kepada Pengguna RAM. Anda dapat membuat Pasangan Kunci Akses untuk Akun Alibaba Cloud Anda atau Pengguna RAM. Anda harus menggunakan Pasangan Kunci Akses tersebut untuk verifikasi identitas saat memanggil Operasi API Alibaba Cloud. Untuk informasi lebih lanjut, lihat Dapatkan Pasangan Kunci Akses.

Prosedur

Masuk ke Konsol RAM sebagai administrator RAM.
Buat Pengguna RAM.

Untuk informasi lebih lanjut, lihat Buat Pengguna RAM.
Berikan kebijakan sistem AliyunYundunGreenWebFullAccess kepada Pengguna RAM.

Untuk informasi lebih lanjut, lihat Berikan izin kepada Pengguna RAM.

Setelah menyelesaikan langkah-langkah di atas, Anda dapat memanggil API Content Moderation sebagai Pengguna RAM.

Langkah 3: Instal dan integrasikan SDK

Wilayah berikut didukung:

Wilayah	Titik akhir Internet	Titik akhir internal
Singapura	https://green-cip.ap-southeast-1.aliyuncs.com	https://green-cip-vpc.ap-southeast-1.aliyuncs.com
AS (Virginia)	https://green-cip.us-east-1.aliyuncs.com	https://green-cip-vpc.us-east-1.aliyuncs.com

Catatan

Jika Anda memerlukan contoh kode SDK dalam bahasa lain, Anda dapat menggunakan alat debugging daring di Portal Pengembang OpenAPI untuk melakukan debugging Operasi API. Alat ini secara otomatis menghasilkan contoh kode SDK untuk Operasi API tersebut.

API

Catatan penggunaan

Titik akhir layanan: https://green-cip.{region}.aliyuncs.com.

Anda dapat memanggil operasi ini untuk membuat tugas moderasi konten audio. Anda dapat menyusun permintaan HTTP secara manual atau menggunakan SDK. Untuk informasi tentang cara menyusun permintaan HTTP manual, lihat Lakukan panggilan HTTP mentah. Untuk informasi lebih lanjut tentang SDK, lihat SDK dan panduan integrasi Audio Moderation 2.0.

API Operations:
- Kirimkan tugas moderasi: VoiceModeration
- Kueri hasil tugas moderasi: VoiceModerationResult
Billing:
Ini adalah operasi berbayar. Anda hanya dikenai biaya untuk permintaan yang mengembalikan kode status HTTP 200. Permintaan yang mengembalikan kode kesalahan lainnya tidak dikenai biaya.

Kirimkan tugas moderasi

Parameter permintaan

Nama

Tipe

Wajib

Contoh

Deskripsi

Service

String

udio_multilingual_global

Jenis layanan moderasi. Nilai yang valid:

audio_multilingual_global: Deteksi multibahasa untuk media audio dan video
stream_multilingual_global: Deteksi multibahasa untuk siaran langsung sosial dan hiburan

ServiceParameters

JSONString

Kumpulan parameter yang diperlukan oleh layanan moderasi. Ini adalah string JSON. Untuk deskripsi setiap string, lihat ServiceParameters.

Tabel 1. ServiceParameters

Nama	Tipe	Wajib	Contoh	Deskripsi
url	String	Ya	http://aliyundoc.com/test.flv	URL objek yang akan dideteksi. Harus berupa URL HTTP atau HTTPS publik.
callback	String	Tidak	http://aliyundoc.com	URL tempat hasil moderasi dikirim sebagai notifikasi callback. HTTP dan HTTPS didukung. Jika Anda mengosongkan bidang ini, Anda harus melakukan polling secara berkala untuk mendapatkan hasil moderasi. Antarmuka callback harus mendukung metode POST, data berkode UTF-8, dan parameter form checksum dan content. Content Moderation menetapkan parameter checksum dan content serta memanggil antarmuka callback Anda untuk mengembalikan hasil moderasi sesuai aturan dan format berikut. checksum: String yang dihasilkan dengan menggabungkan `UID pengguna + seed + content` lalu menerapkan algoritma SHA256. UID pengguna adalah ID akun Alibaba Cloud Anda, yang dapat Anda temukan di Konsol Manajemen Alibaba Cloud. Untuk proteksi anti-pemalsuan, Anda dapat menghasilkan string menggunakan algoritma yang sama saat menerima hasil yang didorong dan memverifikasinya terhadap checksum. Catatan UID pengguna harus merupakan UID akun Alibaba Cloud Anda, bukan UID Pengguna RAM. content: String JSON. Uraikan menjadi objek JSON. Untuk contoh hasil content, lihat tanggapan contoh untuk mengkueri hasil moderasi. Catatan Setelah antarmuka callback server Anda menerima hasil yang didorong oleh Content Moderation, jika mengembalikan kode status HTTP 200, penerimaan berhasil. Kode status HTTP lainnya dianggap gagal. Jika gagal, Content Moderation akan mencoba mendorong ulang hasil hingga 16 kali sampai berhasil diterima. Jika masih belum diterima setelah 16 kali percobaan, dorongan dihentikan. Periksa status antarmuka callback Anda.
seed	String	Tidak	abc****	String acak yang digunakan untuk tanda tangan dalam permintaan notifikasi callback. Dapat berisi huruf, angka, dan garis bawah (_), serta tidak boleh melebihi 64 karakter. Anda dapat menyesuaikan nilai ini untuk memverifikasi bahwa permintaan notifikasi callback diprakarsai oleh layanan Content Moderation Alibaba Cloud. Catatan Bidang ini wajib diisi saat menggunakan callback.
cryptType	String	Tidak	SHA256	Saat menggunakan notifikasi callback (callback), ini menetapkan algoritma enkripsi untuk konten notifikasi. Content Moderation mengenkripsi hasil (string yang digabung dari `UID pengguna + seed + content`) menggunakan algoritma yang Anda tentukan sebelum mengirimkannya ke alamat notifikasi callback Anda. Nilai yang valid: SHA256 (default): Menggunakan algoritma enkripsi SHA256. SM3: Menggunakan algoritma HMAC SM3. Mengembalikan string heksadesimal berupa huruf kecil dan angka. Misalnya, `abc` yang dienkripsi dengan SM3 menghasilkan `66c7f0f462eeedd9d1f2d46bdc10e4e24167c4875cf2f7a2297da02b8f4ba8e0`.
liveId	String	Tidak	liveId1****	ID aliran audio langsung. Parameter ini digunakan untuk menghapus duplikat tugas aliran audio langsung dan mencegah moderasi berulang. Jika Anda mengirimkan parameter ini, sistem akan memeriksa apakah ada tugas moderasi yang sedang berlangsung berdasarkan `uid+service+liveId`. Jika tugas sudah ada, sistem akan mengembalikan taskId moderasi langsung yang sudah ada alih-alih memulai yang baru.
dataId	String	Tidak	voice20240307***	ID data yang sesuai dengan objek yang terdeteksi. ID tersebut dapat terdiri atas huruf besar dan kecil, angka, garis bawah (_), tanda hubung (-), dan titik (.), serta tidak boleh melebihi 64 karakter. Anda dapat menggunakannya untuk mengidentifikasi data bisnis Anda secara unik.

Parameter kembali

Nama	Tipe	Contoh	Deskripsi
Code	Integer	200	Kode kesalahan. Ini konsisten dengan kode status HTTP. Untuk informasi lebih lanjut, lihat Deskripsi kode.
Data	JSONObject	{"taskId": "AAAAA-BBBBB"}	Data hasil moderasi.
Message	String	OK	Pesan tanggapan untuk permintaan.
RequestId	String	AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****	ID permintaan.

Contoh

Contoh permintaan

{
  "service":"audio_multilingual_global",
  "serviceParameters":"{\"cryptType\":\"SHA256\",\"seed\":\"abc***123\",\"callback\":\"https://aliyun.com/callback\",\"url\":\"http://aliyundoc.com/test.flv"}"
}

Contoh respons

{
  "code":200,
  "data":{
    "taskId":"AAAAA-BBBBB"
  },
  "message":"SUCCESS",
  "requestId":"AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}

Kueri hasil tugas

Setelah tugas moderasi selesai, hasil kueri mengembalikan data untuk semua segmen audio.

Parameter permintaan

Nama	Tipe	Wajib	Contoh	Deskripsi
Service	String	Ya	audio_multilingual_global	Jenis layanan moderasi.
ServiceParameters	JSONString	Ya		Kumpulan parameter yang diperlukan oleh layanan moderasi. Ini adalah string JSON. Untuk deskripsi setiap string, lihat ServiceParameters.

Tabel 2. ServiceParameters

Nama	Tipe	Wajib	Contoh	Deskripsi
taskId	String	Ya	AAAAA-BBBBB	ID yang dikembalikan saat tugas dikirimkan.

Parameter respons

Nama	Tipe	Contoh	Deskripsi
Code	Integer	200	Kode kesalahan. Ini konsisten dengan kode status HTTP. Untuk informasi lebih lanjut, lihat Deskripsi kode.
Data	JSONObject	{"url":xxxx,"results":xxx}	Parameter yang dikembalikan dalam format JSON.
Message	String	OK	Pesan tanggapan untuk permintaan.
RequestId	String	AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****	ID permintaan.

Tabel 3. Data

Nama	Tipe	Contoh	Deskripsi
url	String	https://aliyundoc.com	URL objek yang dideteksi.
LiveId	String	liveId1****	ID aliran audio langsung (opsional).
DataId	String	voice20240307***	Data ID yang sesuai dengan objek yang dideteksi (opsional).
RiskLevel	String	high	Tingkat risiko audio, dihitung berdasarkan semua segmen audio. Nilai yang dikembalikan meliputi: high: Risiko tinggi medium: Risiko menengah low: Risiko rendah none: Tidak ada risiko terdeteksi Catatan Konten berisiko tinggi harus ditangani langsung. Konten berisiko menengah harus ditinjau secara manual. Konten berisiko rendah hanya perlu ditangani jika recall tinggi diperlukan. Jika tidak, perlakukan sama seperti konten tanpa risiko terdeteksi.
sliceDetails	JSONArray		Hasil detail untuk segmen audio. Untuk informasi lebih lanjut, lihat sliceDetails.

Tabel 4. sliceDetails

Nama	Tipe	Contoh	Deskripsi
startTime	Integer	0	Waktu mulai kalimat, dalam detik.
endTime	Integer	4065	Waktu akhir kalimat, dalam detik.
startTimestamp	Integer	1678854649720	Timestamp awal segmen, dalam milidetik.
endTimestamp	Integer	1678854649720	Timestamp akhir segmen, dalam milidetik.
text	String	disgusting	Teks yang dikonversi dari audio.
url	String	https://aliyundoc.com	URL sementara untuk segmen audio. URL berlaku selama 30 menit. Simpan segera.
labels	String	pullinTraffic	Tag, dipisahkan dengan koma (,). Meliputi: Violence: Terorisme contraband: Barang Terlarang Sexual content: Pornografi profanity: Kata Kasar pullinTraffic: Trafik berbasis iklan regional: Konflik regional C_customized: Terdeteksi di pustaka yang ditentukan pengguna
RiskLevel	String	high	Tingkat risiko segmen audio. Nilai yang dikembalikan meliputi: high: Risiko tinggi medium: Risiko menengah low: Risiko rendah none: Tidak ada risiko terdeteksi
riskWords	String	AAA,BBB,CCC	Kata-kata berisiko yang terdeteksi, dipisahkan dengan koma.
riskTips	String	sexuality_Suggestive	Sub-tag, dipisahkan dengan koma.
extend	String	{\"riskTips\":\"sexuality_Suggestive\",\"riskWords\":\"pxxxxy\"}	Bidang cadangan.

Contoh

Contoh permintaan

{
  "service":"audio_multilingual_global",
  "serviceParameters":"{\"taskId\":\"AAAAA-BBBBB"}"
}

Contoh respons

{
    "Code": 200,
    "Data": {
        "DataId": "voice20240307***",
        "LiveId": "liveId1****",
        "RiskLevel": "high",
        "SliceDetails": [
            {
                "EndTime": 4065,
                "Labels": "political_content,xxxx",
                "RiskLevel": "high",
                "RiskTips": "contraband_ProhibitedGoods",
                "RiskWords": "Risk Word A",
                "StartTime": 0,
                "Text": "Content Moderation product test case",
                "Url": "https://aliyundoc.com"
            }
        ]
    },
    "Message": "OK",
    "RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}

Format pesan callback

Data pesan callback dalam format JSON, seperti di bawah ini:

Nama bidang	Tipe bidang	Deskripsi
checksum	String	Checksum. String yang dihasilkan dengan menggabungkan `uid pengguna + seed + content` lalu menerapkan algoritma SHA256. UID pengguna adalah ID akun Alibaba Cloud Anda, yang dapat Anda temukan di Konsol Manajemen Alibaba Cloud. Untuk proteksi anti-pemalsuan, Anda dapat menghasilkan string menggunakan algoritma yang sama saat menerima hasil yang didorong dan memverifikasinya terhadap checksum. Catatan UID pengguna harus merupakan UID akun Alibaba Cloud Anda, bukan UID Pengguna RAM.
taskId	String	ID tugas pesan callback.
content	String	Hasil moderasi yang diserialisasi. Ini adalah string JSON. Uraikan menjadi objek JSON. Format hasil content sama dengan respons untuk mengkueri hasil tugas. Untuk informasi lebih lanjut, lihat Parameter respons.

Deskripsi kode

Berikut adalah deskripsi kode yang dikembalikan oleh operasi. Biaya hanya dikenakan untuk permintaan yang mengembalikan kode 200.

Kode	Deskripsi
200	Permintaan berhasil.
280	Sedang diverifikasi.
400	Parameter permintaan kosong.
401	Parameter permintaan tidak valid.
402	Panjang parameter permintaan tidak memenuhi persyaratan. Periksa dan ubah parameter.
403	Permintaan melebihi batas QPS. Periksa dan sesuaikan batas QPS.
404	Terjadi kesalahan saat mengunduh file yang ditentukan. Periksa file atau coba lagi.
405	Pengunduhan file yang ditentukan habis waktu. File mungkin tidak dapat diakses. Periksa file dan coba lagi.
406	File yang ditentukan melebihi batas ukuran. Periksa file dan coba lagi.
407	Format file yang ditentukan tidak didukung. Periksa file dan coba lagi.
408	Akun tidak memiliki izin untuk memanggil operasi ini. Akun mungkin belum mengaktifkan layanan, memiliki pembayaran tertunda, atau tidak diizinkan mengakses layanan.
480	Jumlah aliran konkuren melebihi batas. Periksa dan sesuaikan konkurensi.
500	Terjadi kesalahan sistem.