Moderasi teks edisi tingkat lanjut 2.0 multibahasa plus - AI Guardrails

Text Moderation V2.0 dilengkapi model multibahasa yang telah ditingkatkan, mampu mendeteksi bahasa secara otomatis, serta mendukung lebih banyak jenis bahasa. Dirancang khusus untuk bisnis internasional, layanan ini juga menyediakan kebijakan moderasi dan sistem pelabelan. Topik ini menjelaskan fitur dan penggunaan layanan multibahasa Text Moderation V2.0.

Fitur

Dibandingkan dengan layanan multibahasa pada Text Moderation 1.0, Text Moderation 2.0 menggunakan kebijakan dan sistem pelabelan terpisah untuk bisnis global. Layanan ini juga menawarkan lebih banyak fitur guna menyederhanakan penggunaan dan membantu tinjauan manual.

Item	Text Moderation 2.0	Text Moderation 1.0
Multilingual support	Mendukung 38 bahasa.	Mendukung 18 bahasa.
Moderation capability	Menggunakan multiple models secara paralel. Kebijakan lebih presisi, disesuaikan dengan bahasa dan wilayah tertentu.	Menggunakan satu model tunggal. Kebijakan menyeimbangkan presisi dan recall berdasarkan karakteristik bahasa.
Labeling system	Menggunakan internationalized labeling system yang mencakup label untuk kata kasar dan konten spesifik wilayah. Mendukung beberapa label risiko dan label detail halus.	Menggunakan sistem pelabelan yang dirancang untuk dan hanya mendukung satu label risiko.
Detection scope	Anda dapat mengonfigurasi semua detection scopes di Konsol, mengaktifkan atau menonaktifkannya sesuai kebutuhan. Setiap cakupan memiliki pemetaan satu-ke-satu dengan hasil deteksi.	Mendukung cakupan deteksi umum, yang tidak memiliki pemetaan satu-ke-satu dengan hasil deteksi.
API features	Menyediakan automatic detection tanpa perlu menentukan bahasa input. Setelah moderasi, API mengembalikan jenis bahasa dan versi terjemahan dalam bahasa Inggris dari teks tersebut untuk membantu tinjauan manual.	Memerlukan Anda untuk menentukan bahasa input dan tidak mengembalikan konten terjemahan.

Bahasa yang didukung

Text Moderation V2.0 mendukung 38 bahasa.

Bahasa	English name	Kode bahasa
English	English	en
Simplified Chinese	Simplified Chinese	zh
Traditional Chinese	Traditional Chinese	zh-tw
Indonesian	Indonesian	id
Malay	Malay	ms
Thai	Thai	th
Vietnamese	Vietnamese	vi
Tagalog	Tagalog	tl
Hindi	Hindi	hi
Arabic	Arabic	ar
Turkish	Turkish	tr
French	French	fr
German	German	de
Russian	Russian	ru
Portuguese	Portuguese	pt
Spanish	Spanish	es
Italian	Italian	it
Dutch	Dutch	nl
Polish	Polish	pl
Japanese	Japanese	ja
Korean	Korean	ko
Urdu	Urdu	ur
Uighur	Uighur	ug
Bengali	Bengali	bn
Persian	Persian	fa
Swedish	Swedish	sv
Danish	Danish	da
Norwegian	Norwegian	no
Icelandic	Icelandic	is
Finnish	Finnish	fi
Belarusian	Belarusian	be
Lithuanian	Lithuanian	lt
Czech	Czech	cs
Slovak	Slovak	sk
Hungarian	Hungarian	hu
Modern Greek	Modern Greek	el
Romanian	Romanian	ro
Irish	Irish	ga

Label internasional

Layanan Content Moderation2.0 Multilingual PLUS menggunakan sistem label internasional. Jika konten mengandung beberapa risiko, layanan akan mengembalikan beberapa label. Label-label tersebut meliputi:

Label	Confidence score	Description
pornographic_adult	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected pornographic content
sexual_terms	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected sexual health content
sexual_suggestive	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected vulgar content
sexual_orientation	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected sexual orientation content
regional_cn	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected domestic political content
regional_illegal	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected illegal political content
regional_controversial	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected political controversy
regional_racism	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected racism
violent_extremist	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected extremist organizations
violent_incidents	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected extremist content
violent_weapons	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected weapons and ammunition
violence_unscList	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	United Nations Security Council Consolidated List
contraband_drug	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected drug-related content
contraband_gambling	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected gambling-related content
inappropriate_ethics	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected unethical content
inappropriate_profanity	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected abusive or insulting content
inappropriate_oral	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected vulgar language
inappropriate_religion	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected religious profanity
pt_to_contact	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected traffic diversion using contact information
pt_to_sites	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Suspected off-site traffic diversion
customized	0–100. Skor yang lebih tinggi menunjukkan keyakinan yang lebih besar.	Matched a keyword in a custom keyword library

Penagihan

Layanan text moderation 2.0 mendukung metode penagihan pay-as-you-go.

Pay-as-you-go

Setelah Anda mengaktifkan layanan text moderation 2.0, metode penagihan default adalah pay-as-you-go. Anda ditagih setiap hari berdasarkan penggunaan aktual. Jika Anda tidak menggunakan layanan, Anda tidak akan dikenai biaya.

Jenis moderasi	Layanan	Harga satuan
Standard text moderation (text_standard)	Multilingual detection for international business: text_multilingual_pro_global	USD 0,3 per 1.000 panggilan API
Advanced text moderation (text_advanced)	Text translation feature	USD 0,6 per 1.000 panggilan API Catatan Setelah fitur terjemahan teks diaktifkan, setiap permintaan ditagih sekali per 500 karakter.

Offset paket sumber daya

Untuk kebutuhan moderasi yang besar atau konsisten, kami merekomendasikan pembelian paket sumber daya. Paket yang lebih besar memberikan diskon lebih besar. Anda dapat membeli dan menggunakan beberapa paket sumber daya. Untuk informasi selengkapnya, lihat Beli paket sumber daya untuk Content Moderation 2.0.

Paket sumber daya ini mengimbangi penggunaan Content Moderation 2.0 dan tidak kompatibel dengan paket penggunaan Content Moderation 1.0. Tabel berikut menjelaskan faktor offset.

Jenis moderasi	Layanan	Faktor offset
Basic text moderation (text_standard)	Multilingual detection for international business (pro): text_multilingual_pro_global	Faktor offset adalah 1. Setiap panggilan API yang berhasil mengurangi kuota penggunaan paket sumber daya sebanyak 1 panggilan API. Catatan Contohnya, jika paket sumber daya Anda memiliki kuota penggunaan 10 panggilan API, satu panggilan API yang berhasil akan mengurangi 1 panggilan API dari paket tersebut, sehingga sisa saldo menjadi 9 panggilan API.
Advanced text moderation (text_advanced)	Text translation feature	Faktor offset adalah 2. Setiap panggilan API yang berhasil mengurangi kuota penggunaan paket sumber daya sebanyak 2 panggilan API. Catatan Contohnya, jika paket sumber daya Anda memiliki kuota penggunaan 10 panggilan API, satu panggilan API yang berhasil akan mengurangi 2 panggilan API dari paket tersebut, sehingga sisa saldo menjadi 8 panggilan API.

Integrasi

Langkah 1: Aktifkan layanan

Untuk mengaktifkan layanan Text Moderation 2.0 Edition, kunjungi Aktifkan Layanan.

Setelah Anda mengaktifkan layanan Text Moderation 2.0 Edition, metode penagihan default adalah pay-as-you-go. Anda ditagih setiap hari berdasarkan penggunaan aktual. Anda tidak dikenai biaya jika tidak memanggil layanan. Setelah Anda mengintegrasikan API, sistem secara otomatis menagih Anda berdasarkan penggunaan. Untuk informasi selengkapnya, lihat Penagihan.

Langkah 2: Berikan izin kepada Pengguna RAM

Sebelum mengintegrasikan SDK atau API, berikan izin kepada Pengguna RAM. Anda dapat membuat AccessKey untuk Akun Alibaba Cloud atau Pengguna RAM. AccessKey mengotentikasi identitas Anda saat memanggil API Alibaba Cloud. Untuk mengetahui cara mendapatkan AccessKey, lihat Dapatkan AccessKey.

Berikan izin kepada Pengguna RAM

Masuk ke Konsol RAM menggunakan Akun Alibaba Cloud Anda.
Buat Pengguna RAM. Untuk detailnya, lihat Buat Pengguna RAM.
Berikan kebijakan sistem AliyunYundunGreenWebFullAccess kepada Pengguna RAM. Kebijakan ini memberikan akses penuh ke Content Moderation. Untuk detailnya, lihat Kelola izin Pengguna RAM.
Pengguna RAM kini dapat memanggil API Content Moderation.

Langkah 3: Instal dan integrasikan SDK

Layanan tersedia di wilayah-wilayah berikut. Untuk mengintegrasikan SDK Text Moderation Enhanced Edition, lihat Panduan Integrasi.

Wilayah	Titik akhir publik	Titik akhir internal
Singapore	green-cip.ap-southeast-1.aliyuncs.com	green-cip-vpc.ap-southeast-1.aliyuncs.com
UK (London)	green-cip.eu-west-1.aliyuncs.com	Not available
US (Virginia)	green-cip.us-east-1.aliyuncs.com	green-cip-vpc.us-east-1.aliyuncs.com
US (Silicon Valley)	green-cip.us-west-1.aliyuncs.com	Not available
Germany (Frankfurt)	green-cip.eu-central-1.aliyuncs.com	green-cip-vpc.eu-central-1.aliyuncs.com

Catatan

Kelola konfigurasi untuk wilayah UK (London) di Konsol wilayah Singapura, dan untuk wilayah US (Silicon Valley) di Konsol wilayah US (Virginia).

API

Penggunaan

Operasi API: TextModerationPlus

Gunakan operasi ini untuk membuat tugas moderasi konten teks. Untuk mengetahui cara menyusun permintaan HTTP, lihat Struktur permintaan. Anda juga dapat menggunakan permintaan HTTP yang telah disediakan. Untuk informasi selengkapnya, lihat Panduan integrasi.

Penagihan:
Ini adalah operasi berbayar. Anda hanya dikenai biaya untuk permintaan yang berhasil dan mengembalikan kode status 200. Permintaan yang mengembalikan kode status lain tidak ditagih. Untuk informasi selengkapnya tentang penagihan, lihat Penagihan.

Batas QPS

Batas QPS untuk operasi ini adalah 100 permintaan per detik per pengguna. Panggilan API yang melebihi batas ini akan dikendalikan alirannya (throttled), yang dapat memengaruhi bisnis Anda. Rencanakan panggilan Anda dengan sesuai.

Parameter permintaan

Parameter	Tipe	Wajib	Contoh	Deskripsi
Service	String	Ya	text_multilingual_pro_global	Jenis layanan moderasi. Tetapkan nilainya ke text_multilingual_pro_global untuk moderasi multibahasa layanan internasional.
ServiceParameters	JSONString	Ya		Kumpulan parameter untuk layanan moderasi, disediakan sebagai string JSON. Untuk detail parameter, lihat ServiceParameters.

Tabel 1. ServiceParameters

Parameter

Tipe

Wajib

Contoh

Deskripsi

content

String

testing content

Konten teks yang akan dimoderasi. Panjang konten maksimal 600 karakter.

dataId

String

Tidak

text0424****

ID data objek yang akan dimoderasi.

ID dapat berisi huruf kapital dan kecil, angka, garis bawah (_), tanda hubung (-), dan titik (.). Panjang ID maksimal 64 karakter dan dapat digunakan untuk mengidentifikasi data bisnis Anda secara unik.

Parameter respons

Parameter	Tipe	Contoh	Deskripsi
Code	Integer	200	Kode status. Untuk informasi selengkapnya, lihat Detail kode.
Data	JSONObject		Data hasil moderasi. Untuk informasi selengkapnya, lihat Data.
Message	String	OK	Pesan respons.
RequestId	String	AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****	ID permintaan.

Tabel 2. Data

Parameter	Tipe	Contoh	Deskripsi
Result	JSONArray		Hasil moderasi, termasuk label risiko, skor keyakinan, dan detail lainnya. Untuk informasi selengkapnya, lihat Result.
DataId	String	text0424****	ID data objek yang dimoderasi. Catatan Parameter ini hanya dikembalikan jika `dataId` ditentukan dalam permintaan.
RiskLevel	String	high	Tingkat risiko, ditentukan oleh ambang batas skor risiko yang dikonfigurasi. Nilai yang valid: `high`: Risiko tinggi. Jika konten sesuai dengan kata kunci dalam pustaka kata kunci kustom, tingkat risiko secara default menjadi tinggi. `medium`: Risiko sedang. `low`: Risiko rendah. `none`: Tidak ada risiko yang terdeteksi. Catatan Kami merekomendasikan untuk langsung menangani konten berisiko tinggi dan melakukan tinjauan manual terhadap konten berisiko sedang. Proses konten berisiko rendah hanya jika diperlukan tingkat recall yang tinggi; jika tidak, konten tersebut dapat dianggap bebas risiko. Anda dapat mengonfigurasi ambang batas skor risiko di Konsol Content Moderation.
TranslatedContent	String	Translated text	Konten teks yang diterjemahkan. Hanya dikembalikan setelah fitur terjemahan teks diaktifkan. Catatan Fitur terjemahan teks saat ini hanya didukung di wilayah Singapura. Konfigurasikan fitur ini di bawah manajemen aturan deteksi di Konsol. Mengaktifkan fitur ini akan dikenai biaya tambahan. Untuk detail penagihan, lihat Penagihan.
DetectedLanguage	String	en	Bahasa yang terdeteksi.

Tabel 3. Result

Parameter	Tipe	Contoh	Deskripsi
Label	String	political_xxx	Label moderasi. Satu konten dapat menerima beberapa label dan skor keyakinan. Untuk daftar label yang didukung, lihat Label internasional.
Confidence	Float	81,22	Skor keyakinan, berkisar antara 0 hingga 100. Nilai ini akurat hingga dua tempat desimal. Beberapa label tidak memiliki skor keyakinan.
Riskwords	String	AA,BB,CC	Kata sensitif yang terdeteksi. Beberapa kata sensitif dipisahkan dengan koma. Parameter ini tidak dikembalikan untuk beberapa label.
CustomizedHit	JSONArray	[{"LibName":"...","Keywords":"..."}]	Dikembalikan jika konten sesuai dengan kata kunci dalam pustaka kata kunci kustom (ketika `Label` bernilai `customized`). Parameter ini menyediakan nama pustaka kustom dan kata kunci kustom yang sesuai. Untuk informasi selengkapnya, lihat CustomizedHit.
Description	String	Suspected pornographic content	Deskripsi bidang `Label`. Penting Bidang ini memberikan penjelasan yang mudah dibaca manusia mengenai `Label` dan dapat berubah sewaktu-waktu. Untuk pemrosesan otomatis, dasarkan logika Anda pada bidang `Label`, bukan bidang `Description` ini.

Tabel 4. CustomizedHit

Parameter	Tipe	Contoh	Deskripsi
LibName	String	Custom library 1	Nama pustaka kata kunci kustom.
Keywords	String	Custom keyword 1,Custom keyword 2	Kata kunci kustom yang sesuai. Beberapa kata kunci dipisahkan dengan koma.

Contoh

Contoh permintaan

{
    "Service": "text_multilingual_pro_global",
    "ServiceParameters": {
        "content": "testing content",
        "dataId": "text0424****"
    }
}

Contoh respons

Pencocokan kebijakan sistem:

{
    "Code": 200,
    "Data": {
        "Result": [
            {
                "Label": "political_entity",
                "Description": "Suspected political entity",
                "Confidence": 100.0,
                "RiskWords": "Word A,Word B,Word C"
            },
            {
                "Label": "political_figure",
                "Description": "Suspected political figure",
                "Confidence": 100.0,
                "RiskWords": "Word A,Word B,Word C"
            }
        ],
        "RiskLevel": "high",
        "DetectedLanguage": "en",
        "TranslatedContent": "Translated content",
        "DataId": "text0424****"
    },
    "Message": "OK",
    "RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}

Pencocokan pustaka kata kunci kustom:

{
    "Code": 200,
    "Data": {
        "Result": [
            {
                "Description": "Matched a custom keyword library",
                "CustomizedHit": [
                    {
                        "LibName": "Custom keyword library name 1",
                        "KeyWords": "Custom keyword"
                    }
                ],
                "Confidence": 100,
                "Label": "customized"
            }
        ],
        "RiskLevel": "high",
        "DataId": "text0424****"
    },
    "Message": "OK",
    "RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}

Kode

Kode	Kode status	Deskripsi
200	OK	Permintaan berhasil.
400	BAD_REQUEST	Permintaan tidak valid. Periksa parameter permintaan Anda.
407	NOT_SUPPORT	Bahasa tidak dikenali atau tidak didukung.
408	PERMISSION_DENY	Izin ditolak. Hal ini dapat terjadi jika akun Anda tidak memiliki otorisasi, memiliki pembayaran tertunda, atau layanan tidak aktif atau diblokir.
500	GENERAL_ERROR	Terjadi kesalahan di sisi server. Ulangi permintaan. Jika kesalahan tetap berlanjut, hubungi kami melalui dukungan online.
581	TIMEOUT	Permintaan melebihi waktu tunggu. Ulangi permintaan. Jika kesalahan tetap berlanjut, hubungi kami melalui dukungan online.
588	EXCEED_QUOTA	Laju permintaan melebihi batas QPS.