Moderasi Teks 2.0 menawarkan kemampuan model multibahasa yang lebih baik, mendukung identifikasi otomatis bahasa dan lebih banyak bahasa. Layanan ini menyediakan kebijakan moderasi serta sistem tag yang disesuaikan untuk skenario bisnis internasional. Topik ini menjelaskan fitur dan penggunaan layanan multibahasa Moderasi Teks 2.0.
Fitur
Dibandingkan dengan layanan moderasi multibahasa Moderasi Teks 1.0, Moderasi Teks 2.0 menggunakan kebijakan independen dan sistem tag untuk memenuhi persyaratan bisnis internasional. Fitur tambahan juga disertakan untuk menyederhanakan operasi bisnis dan membantu tinjauan manual.
Item Perbandingan | Moderasi Teks 2.0 | Moderasi Teks 1.0 |
Kemampuan multibahasa | Mendukung 38 bahasa. | Mendukung 18 bahasa. |
Kemampuan moderasi | Menggunakan beberapa model secara paralel. Kebijakan lebih presisi karena didasarkan pada atribut bahasa dan wilayah. | Menggunakan satu model. Kebijakan menyeimbangkan akurasi dan recall berdasarkan atribut bahasa. |
Sistem tag | Menggunakan sistem tag internasional, yang menambahkan tag seperti profanitas dan regional, serta mendukung berbagai tag risiko dan sub-tag. | Menggunakan sistem tag untuk skenario Cina dan hanya mendukung satu tag risiko. |
Ruang lingkup deteksi | Anda dapat mengonfigurasi semua ruang lingkup deteksi di konsol dan mengaktifkan atau menonaktifkannya sesuai kebutuhan. Konfigurasi langsung dipetakan ke hasil deteksi. | Mendukung ruang lingkup deteksi umum, yang tidak langsung dipetakan ke hasil deteksi. |
Fitur API | Tidak perlu menentukan bahasa input karena layanan dapat mengidentifikasi secara otomatis. Setelah moderasi, layanan mengembalikan jenis bahasa dan konten terjemahan dalam bahasa Inggris untuk membantu tinjauan manual. | Anda harus menentukan bahasa input. Layanan tidak mengembalikan konten terjemahan. |
Bahasa yang Didukung
Layanan multibahasa Moderasi Teks 2.0 mendukung 38 bahasa.
Jenis Bahasa | Nama Inggris | Kode Bahasa |
Bahasa Inggris | Inggris | en |
Bahasa Cina Sederhana | Cina | zh |
Bahasa Cina Tradisional | Cina Tradisional | zh-tw |
Bahasa Indonesia | Bahasa Indonesia | id |
Bahasa Melayu | Melayu | ms |
Bahasa Thai | Thai | th |
Bahasa Vietnam | Bahasa Vietnam | vi |
Bahasa Tagalog | Tagalog | tl |
Bahasa Hindi | Hindi | hi |
Bahasa Arab | Arab | ar |
Bahasa Turki | Turki | tr |
Bahasa Prancis | Prancis | fr |
Bahasa Jerman | Jerman | de |
Bahasa Rusia | Rusia | ru |
Bahasa Portugis | Portugis | pt |
Bahasa Spanyol | Spanyol | es |
Bahasa Italia | Italia | it |
Bahasa Belanda | Belanda | nl |
Bahasa Polandia | Polandia | pl |
Bahasa Jepang | Jepang | ja |
Bahasa Korea | Korea | ko |
Bahasa Urdu | Urdu | ur |
Bahasa Uighur | Uighur | ug |
Bahasa Bengali | Bengali | bn |
Bahasa Persia | Persia | fa |
Bahasa Swedia | Swedia | sv |
Bahasa Denmark | Denmark | da |
Bahasa Norwegia | Norwegia | no |
Bahasa Islandia | Islandia | is |
Bahasa Finlandia | Finlandia | fi |
Bahasa Belarusia | Belarusia | be |
Bahasa Lituania | Lituania | lt |
Bahasa Ceko | Ceko | cs |
Bahasa Slovakia | Slovak | sk |
Bahasa Hungaria | Hungaria | hu |
Bahasa Yunani Modern | Yunani Modern | el |
Bahasa Rumania | Rumania | ro |
Bahasa Irlandia | Irlandia | ga |
Tag Internasional
Layanan PLUS Multibahasa Moderasi Teks 2.0 menggunakan sistem tag internasional. Jika konten mengandung beberapa jenis risiko, beberapa tag dapat dikembalikan secara bersamaan. Kategori tag meliputi, namun tidak terbatas pada, hal-hal berikut:
Label | Rentang skor kepercayaan | Deskripsi |
pornographic_adult | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga pornografi |
sexual_terms | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga terkait kesehatan seksual |
sexual_suggestive | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga vulgar |
sexual_orientation | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga orientasi seksual |
regional_cn | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga politik domestik |
regional_illegal | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga politik ilegal |
regional_controversial | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga kontroversi politik |
regional_racism | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga rasisme |
violent_extremist | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga organisasi ekstremis |
violent_incidents | 0 hingga 100. Semakin tingtinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga ekstremisme |
violent_weapons | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga senjata dan amunisi |
violence_unscList | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Daftar Konsolidasi Dewan Keamanan PBB |
contraband_drug | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga terkait narkoba |
contraband_gambling | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga terkait perjudian |
inappropriate_ethics | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga memiliki nilai-nilai yang tidak diinginkan |
inappropriate_profanity | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga kasar atau menghina |
inappropriate_oral | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga vulgar secara lisan |
inappropriate_religion | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Konten diduga penghinaan agama |
pt_to_contact | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Kontak informasi yang diduga untuk iklan |
pt_to_sites | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Pengalihan lalu lintas ke situs lain yang diduga |
customized | 0 hingga 100. Semakin tinggi skor, semakin tinggi tingkat kepercayaan. | Mengenai pustaka kata kunci kustom |
Penagihan
Layanan Moderasi Teks 2.0 mendukung metode penagihan bayar sesuai pemakaian.
Bayar Sesuai Pemakaian
Setelah Anda mengaktifkan layanan Moderasi Teks 2.0, metode penagihan default adalah bayar sesuai pemakaian. Anda akan dikenakan biaya berdasarkan penggunaan aktual Anda setiap hari. Jika Anda tidak memanggil layanan, Anda tidak akan dikenakan biaya.
Jenis Moderasi | Skenario bisnis yang didukung (layanan) | Harga satuan |
Moderasi teks dasar (text_standard) | Pendeteksian multibahasa untuk bisnis internasional (versi profesional): comment_multilingual_pro_global | USD 0,3 per 1.000 panggilan |
Panduan Integrasi
Langkah 1: Aktifkan Layanan
Kunjungi Aktifkan Layanan untuk mengaktifkan layanan Moderasi Teks 2.0.
Setelah Anda mengaktifkan layanan Moderasi Teks 2.0, metode penagihan default adalah bayar sesuai pemakaian. Anda akan dikenakan biaya berdasarkan penggunaan aktual Anda setiap hari. Jika Anda tidak memanggil layanan, Anda tidak akan dikenakan biaya. Setelah Anda mengintegrasikan dengan API, sistem akan secara otomatis menghasilkan tagihan berdasarkan penggunaan Anda. Untuk informasi lebih lanjut, lihat Penagihan.
Langkah 2: Berikan Izin kepada Pengguna RAM
Sebelum Anda mengintegrasikan dengan SDK atau API, Anda harus memberikan izin kepada pengguna RAM. Anda dapat membuat Pasangan Kunci Akses untuk Akun Alibaba Cloud atau pengguna RAM. Anda harus menggunakan Pasangan Kunci Akses untuk menyelesaikan verifikasi identitas saat Anda memanggil API Alibaba Cloud. Untuk informasi lebih lanjut tentang cara mendapatkan Pasangan Kunci Akses, lihat Dapatkan Pasangan Kunci Akses.
Prosedur
Masuk ke Konsol RAM sebagai administrator RAM.
- Buat pengguna RAM.
Untuk informasi lebih lanjut, lihat Buat Pengguna RAM.
- Berikan kebijakan sistem
AliyunYundunGreenWebFullAccesskepada pengguna RAM.Untuk informasi lebih lanjut, lihat Berikan Izin kepada Pengguna RAM.
Setelah menyelesaikan operasi sebelumnya, Anda dapat memanggil API Moderasi Konten sebagai pengguna RAM.
Langkah 3: Instal dan Integrasikan dengan SDK
Layanan ini tersedia di wilayah berikut. Untuk informasi lebih lanjut tentang SDK untuk layanan Moderasi Teks 2.0, lihat Panduan Integrasi.
Wilayah | Endpoint Publik | Endpoint VPC |
Singapura | green-cip.ap-southeast-1.aliyuncs.com | green-cip-vpc.ap-southeast-1.aliyuncs.com |
Inggris (London) | https://green-cip.eu-west-1.aliyuncs.com | Tidak tersedia |
AS (Virginia) | https://green-cip.us-east-1.aliyuncs.com | https://green-cip-vpc.us-east-1.aliyuncs.com |
AS (Silicon Valley) | https://green-cip.us-west-1.aliyuncs.com | Tidak tersedia |
Jerman (Frankfurt) | green-cip.eu-central-1.aliyuncs.com | Tidak tersedia |
Konfigurasi untuk wilayah Inggris (London) menggunakan kembali konfigurasi konsol wilayah Singapura. Konfigurasi untuk wilayah AS (Silicon Valley) dan Jerman (Frankfurt) menggunakan kembali konfigurasi konsol wilayah AS (Virginia).
API
Catatan Penggunaan
Antarmuka Bisnis: TextModerationPlus
Anda dapat memanggil operasi ini untuk membuat tugas moderasi konten teks. Untuk informasi lebih lanjut tentang cara membuat permintaan HTTP, lihat Struktur Permintaan. Anda juga dapat menggunakan contoh permintaan HTTP. Untuk informasi lebih lanjut, lihat Panduan Integrasi.
Informasi Penagihan:
Ini adalah operasi yang dapat dikenakan biaya. Anda hanya akan dikenakan biaya untuk permintaan yang mengembalikan kode status HTTP 200. Anda tidak akan dikenakan biaya untuk permintaan yang mengembalikan kode kesalahan lainnya. Untuk informasi lebih lanjut tentang metode penagihan, lihat Penagihan.
Batas QPS
Batas permintaan per detik (QPS) untuk satu pengguna pada API ini adalah 100 panggilan per detik. Jika Anda melebihi batas ini, panggilan API Anda akan dibatasi, yang dapat memengaruhi bisnis Anda.
Parameter Permintaan
Nama | Tipe | Diperlukan | Contoh | Deskripsi |
Service | String | Ya | comment_multilingual_pro_global | Jenis layanan moderasi. Nilai valid: comment_multilingual_pro_global: pendeteksian multibahasa untuk bisnis internasional |
ServiceParameters | JSONString | Ya | Set parameter yang diperlukan oleh layanan moderasi. Ini adalah string JSON. Untuk informasi lebih lanjut tentang setiap string, lihat ServiceParameters. |
Tabel 1. ServiceParameters
Nama | Tipe | Diperlukan | Contoh | Deskripsi |
content | String | Ya | Konten yang akan dideteksi | Konten teks yang akan dimoderasi. Teks tidak boleh melebihi 600 karakter panjangnya. |
dataId | String | Tidak | text0424**** | ID data yang sesuai dengan objek deteksi. Dapat terdiri dari huruf besar, huruf kecil, angka, garis bawah (_), tanda hubung (-), dan titik (.). ID tidak boleh melebihi 64 karakter panjangnya dan dapat digunakan untuk mengidentifikasi data bisnis Anda secara unik. |
Parameter Tanggapan
Nama | Tipe | Contoh | Deskripsi |
Code | Integer | 200 | Kode status. Untuk informasi lebih lanjut, lihat Deskripsi Kode. |
Data | JSONObject | Data hasil moderasi. Untuk informasi lebih lanjut, lihat Data. | |
Message | String | OK | Pesan tanggapan untuk permintaan. |
RequestId | String | AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE**** | ID Permintaan. |
Tabel 2. Data
Nama | Tipe | Contoh | Deskripsi |
Hasil | JSONArray | Hasil seperti label risiko yang terdeteksi dan skor kepercayaan. Untuk informasi lebih lanjut, lihat Hasil. | |
DataId | String | text0424**** | ID data yang sesuai dengan objek deteksi. Catatan Jika Anda melewati dataId dalam parameter permintaan untuk deteksi, dataId yang sesuai akan dikembalikan di sini. |
Tingkat Risiko | String | tinggi | Tingkat risiko, yang dikembalikan berdasarkan skor risiko tinggi dan rendah yang dikonfigurasi. Nilai valid:
Catatan Kami menyarankan Anda untuk menangani konten berisiko tinggi secara langsung. Kami menyarankan Anda untuk meninjau konten berisiko menengah secara manual. Kami menyarankan Anda untuk menangani konten berisiko rendah hanya jika Anda memiliki persyaratan recall yang tinggi. Dalam kasus lain, kami menyarankan Anda untuk menangani konten berisiko rendah dengan cara yang sama seperti konten tanpa risiko yang terdeteksi. Anda dapat mengonfigurasi skor risiko di Konsol Content Moderation. |
Konten Terjemahan | String | Teks terjemahan | Konten teks terjemahan. |
DetectedLanguage | String | en | Bahasa yang terdeteksi. |
Tabel 3. Hasil
Nama | Tipe | Contoh | Deskripsi |
Label | String | political_xxx | Label yang dikembalikan setelah konten teks dimoderasi. Beberapa label dan skor mungkin terdeteksi. Untuk informasi lebih lanjut tentang label yang didukung, lihat bagian Tag Internasional. |
Kepercayaan | Float | 81,22 | Skor kepercayaan, berkisar dari 0 hingga 100 dan akurat hingga dua tempat desimal. Beberapa label tidak memiliki skor kepercayaan. |
KataRisiko | String | AA,BB,CC | Kata-kata sensitif yang terdeteksi. Beberapa kata dipisahkan oleh koma. Beberapa label tidak mengembalikan kata-kata sensitif. |
CustomizedHit | JSONArray | [{"LibName":"...","Keywords":"..."}] | Saat pustaka kustom terkena, Label adalah customized, dan nama pustaka kustom serta kata-kata kustom dikembalikan. Untuk informasi lebih lanjut, lihat CustomizedHit. |
Deskripsi | String | Konten diduga pornografi | Deskripsi dari bidang Label. Penting Bidang ini adalah penjelasan dari bidang Label. Ini mungkin berubah atau disesuaikan. Kami menyarankan Anda untuk menangani bidang Label untuk hasil pemrosesan aktual dan tidak bergantung pada bidang ini untuk disposisi hasil. |
Tabel 4. CustomizedHit
Nama | Tipe | Contoh | Deskripsi |
LibName | String | Pustaka Kustom 1 | Nama pustaka kustom. |
KataKunci | String | Kata Kustom 1,Kata Kustom 2 | Kata-kata kustom. Beberapa kata dipisahkan oleh koma. |
Contoh
Contoh Permintaan
{
"Layanan": "comment_detection_pro_global",
"ParameterLayanan": {
"konten": "konten uji",
"dataId": "text0424****"
}
}Contoh Tanggapan:
Mengenai kebijakan sistem:
{
"Kode": 200,
"Data": {
"Hasil": [
{
"Label": "political_entity",
"Deskripsi": "Diduga entitas politik",
"Kepercayaan": 100.0,
"KataRisiko": "Kata A,Kata B,Kata C"
},
{
"Label": "political_figure",
"Deskripsi": "Diduga tokoh politik",
"Kepercayaan": 100.0,
"KataRisiko": "Kata A,Kata B,Kata C"
}
],
"TingkatRisiko": "tinggi",
"BahasaTerdeteksi": "en",
"KontenTerjemahan": "Konten teks terjemahan",
"DataId": "text0424****"
},
"Pesan": "OK",
"RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}Mengenai pustaka kata kunci kustom:
{
"Kode": 200,
"Data": {
"Hasil": [
{
"Deskripsi": "Mengenai pustaka kustom",
"CustomizedHit": [
{
"NamaPustaka": "Nama Pustaka Kustom 1",
"KataKunci": "Kata Kunci Kustom"
}
],
"Kepercayaan": 100,
"Label": "customized"
}
],
"TingkatRisiko": "tinggi",
"DataId": "text0424****"
},
"Pesan": "OK",
"RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}Deskripsi Kode
Kode | Kode Status | Deskripsi |
200 | OK | Permintaan berhasil. |
400 | BAD_REQUEST | Permintaan tidak valid. Ini mungkin karena parameter permintaan salah. Periksa parameter permintaan dengan cermat. |
407 | NOT_SUPPORT | Jenis bahasa tidak dapat diidentifikasi atau tidak didukung. |
408 | PERMISSION_DENY | Ini mungkin karena akun Anda tidak berwenang, memiliki pembayaran tertunda, belum diaktifkan, atau telah dinonaktifkan. |
500 | GENERAL_ERROR | Telah terjadi kesalahan. Ini mungkin kesalahan sementara di sisi server. Kami menyarankan Anda mencoba lagi. Jika kode kesalahan ini terus berlanjut, hubungi kami melalui dukungan online. |
581 | TIMEOUT | Waktu habis. Kami menyarankan Anda mencoba lagi. Jika kode kesalahan ini terus berlanjut, hubungi kami melalui dukungan online. |
588 | EXCEED_QUOTA | Frekuensi permintaan melebihi kuota. |