Content Moderation mendukung pustaka teks kustom. Anda dapat menggunakan pustaka ini untuk memastikan hasil moderasi sesuai dengan kebutuhan bisnis tertentu, seperti deteksi pelanggaran teks dalam gambar, iklan, anti-spam teks, file, dan audio. Anda juga dapat menentukan teks yang akan diblokir, dilewati, atau ditinjau di berbagai pustaka teks kustom.
Informasi latar belakang
Kami merekomendasikan agar Anda mengikuti petunjuk dalam topik ini untuk menggunakan pustaka teks kustom guna mencegah penambahan istilah yang tidak tepat yang dapat memengaruhi akurasi hasil moderasi.
Pustaka teks kustom mencakup dua jenis: pustaka teks berbasis umpan balik dan pustaka teks yang dikelola sendiri:
Pustaka teks berbasis umpan balik dibuat secara otomatis untuk menampung teks yang telah ditinjau. Secara default, pustaka ini dapat digunakan untuk memoderasi teks dalam semua skenario moderasi dengan tipe yang sama. Anda dapat mengelola teks dalam pustaka ini, tetapi tidak dapat melakukan operasi seperti menonaktifkan atau menghapusnya. Untuk informasi lebih lanjut tentang tinjauan manual, lihat Tinjau Hasil Moderasi Bantuan Mesin.
Pustaka teks yang dikelola sendiri adalah pustaka yang Anda buat untuk memoderasi teks dalam skenario atau jenis moderasi tertentu. Anda dapat mengelola teks serta melakukan operasi pada pustaka ini, seperti mengedit atau menonaktifkannya.
Anda dapat membuat hingga 10 pustaka teks yang dikelola sendiri.
Topik ini menjelaskan cara mengelola pustaka teks kustom melalui konsol Content Moderation. Anda juga dapat mengelola pustaka teks kustom dengan memanggil operasi API atau menggunakan SDK Content Moderation. Untuk informasi lebih lanjut, lihat topik-topik berikut:
Jenis teks
Anda dapat menambahkan istilah dan pola teks ke pustaka teks kustom.
Istilah
Istilah dirancang untuk menyesuaikan kata-kata dalam teks. Jika sebuah kalimat atau bagian teks mencakup istilah tertentu, istilah tersebut akan terpicu. Anda dapat menambahkan berbagai istilah sesuai dengan skenario bisnis yang berbeda.
Dalam identifikasi Content Moderation, teknologi kata kunci dapat diterapkan pada deteksi pelanggaran dalam gambar dan teks anti-spam. Untuk informasi lebih lanjut tentang parameter relevan, lihat deskripsi parameter operasi moderasi dalam skenario yang berbeda. Parameter relevan dalam dua skenario ini mungkin sedikit berbeda.
Anda dapat menambahkan operator logika AND (&) dan NOT (~) dalam istilah bahasa Cina. Contoh:
Istilah "A&B" ditambahkan. Jika sepotong teks mengandung A dan B, istilah tersebut terdeteksi.
Istilah "A~B" ditambahkan. Jika sepotong teks mengandung A tetapi tidak mengandung B, istilah tersebut terdeteksi.
CatatanJika Anda menambahkan kedua operator logika dalam sebuah istilah, operator AND (&) harus ditambahkan sebelum operator NOT (~). Misalnya, Anda dapat menambahkan "A&B~C" sebagai istilah, tetapi tidak dapat menambahkan "A~C&B" sebagai istilah.
Pola Teks
Pola teks dirancang untuk membandingkan kesamaan antara kalimat atau potongan teks. Jika dua kalimat atau potongan teks sedikit berbeda tetapi menyampaikan makna yang sama, mereka dianggap memiliki kesamaan dekat. Content Moderation dapat menentukan apakah sepotong teks memiliki kesamaan dekat dengan pola teks dalam perpustakaan pola teks. Jika kesamaan mencapai tingkat tertentu, pola teks tersebut terdeteksi.
Anda dapat menerapkan perpustakaan pola teks pada teks anti-spam. Content Moderation memungkinkan Anda menyesuaikan daftar hitam, daftar putih, dan daftar tinjauan untuk perpustakaan pola teks berdasarkan kebutuhan bisnis Anda. Daftar tinjauan berisi teks yang memerlukan tinjauan manual. Anda dapat mengelola pola teks terkait bisnis Anda dalam perpustakaan pola teks. Dalam hal ini, konten yang cocok dengan pola teks dapat disaring dalam teks anti-spam.
Batasan
Tipe | Item | Batasan |
Pustaka teks yang dikelola sendiri | Jumlah | Mendukung maksimal 10 pustaka teks yang dikelola sendiri. |
Pustaka teks yang dikelola sendiri | Panjang nama | Mendukung maksimal 20 karakter panjang untuk setiap nama pustaka. |
Istilah | Tipe istilah |
|
Istilah | Jumlah istilah dalam pustaka teks | Mendukung maksimal 10.000 istilah dalam pustaka teks. |
Istilah | Panjang istilah | Mendukung maksimal 50 karakter panjang untuk setiap istilah, termasuk operator logika. |
Istilah | Pengkodean untuk istilah bahasa Cina | UTF-8. |
Istilah | Format istilah | Karakter khusus berikut dalam bentuk full-width dan half-width tidak didukung: Tanda at (@), tanda pagar (#), tanda dolar ($), tanda persen (%), tanda caret (^), tanda asterisk (*), tanda kurung (()), tanda kurung sudut (<>), garis miring (/), tanda tanya (?), koma (,), titik (.), titik koma (;), garis bawah (_), tanda tambah (+), tanda hubung (-), tanda sama dengan (=), tanda kutip tunggal ('), tanda kutip ganda ("), spasi, dan tab. |
Pola teks | Panjang pola teks | Mendukung 20 hingga 4.000 karakter panjang untuk setiap pola teks. Catatan Jika teks yang ditambahkan ke pustaka terlalu panjang, kecocokan tidak valid mungkin terjadi. Kami merekomendasikan agar Anda menetapkan setiap pola teks maksimal 200 karakter panjang. |
Pola teks | Jumlah pola teks dalam pustaka teks | Mendukung maksimal 10.000 pola teks dalam pustaka teks. |
Pola teks | Pengkodean | UTF-8. |
Pola teks | Isi teks | Memerlukan karakteristik semantik bahasa Cina yang jelas yang dapat diekstraksi. Jika sedikit karakteristik semantik yang dapat diidentifikasi dari pola teks, pola teks ini diabaikan. Catatan Pola teks yang terdiri dari huruf, angka, atau emotikon tanpa makna mungkin diabaikan. |
Prosedur
Masuk ke konsol Content Moderation.
Di panel navigasi sisi kiri, pilih .
Klik Create Text Library.
Dalam kotak dialog Create Custom Text Library, atur parameter berdasarkan tabel Parameter untuk Membuat Pustaka Teks Kustom. Lalu, klik OK.
Tabel 1. Parameter untuk Membuat Pustaka Teks Kustom
Parameter
Deskripsi
Name
Nama pustaka teks kustom. Anda dapat menetapkan nama yang sama untuk beberapa pustaka teks. Namun, kami merekomendasikan agar Anda menetapkan nama unik untuk setiap pustaka teks.
Scene
Skenario tempat pustaka teks berlaku. Nilai valid:
Text Anti-spam: text anti-spam where the value of the scene parameter contains antispam in API requests
Ad: image moderation where the value of the scene parameter contains ad in API requests
Type
Tipe teks dari pustaka teks. Nilai valid:
Keyword: mencocokkan teks yang dimoderasi yang mengandung istilah. Anda dapat mendeteksi lebih banyak teks berisiko dengan menggunakan istilah.
Similar Text: mencocokkan teks yang dimoderasi yang serupa dengan pola teks pada probabilitas tertentu. Anda dapat mendeteksi teks berisiko lebih akurat dengan menggunakan pola teks.
CatatanAnda dapat menetapkan parameter ini ke Teks Serupa hanya jika parameter Scene diatur ke Text Anti-spam.
Match Mode
Mode pencocokan yang diterapkan pada pustaka teks kustom. Parameter ini diperlukan jika parameter Type diatur ke Keyword. Nilai valid:
Precise: mencocokkan teks yang dimoderasi yang mengandung istilah yang sama dalam pustaka teks.
Check after Preprocess Texts: memproses pra-pemrosesan istilah dan teks yang dimoderasi, lalu mencocokkan teks yang dimoderasi yang diproses pra-pemrosesan yang cocok dengan istilah yang diproses pra-pemrosesan. Istilah dan teks yang dimoderasi diproses pra-pemrosesan dengan cara berikut:
Mengubah huruf besar menjadi huruf kecil. Misalnya, jika teks yang dimoderasi adalah "bitCoin", istilah "bitcoin" terkena.
Mengubah karakter Cina tradisional menjadi karakter Cina sederhana.
Mengubah kata-kata serupa.
CatatanSecara default, mode Periksa Setelah Pra-pemrosesan Teks dipilih untuk pustaka yang terdiri dari pola teks.
List Category
Kategori hasil moderasi yang dikembalikan berdasarkan pustaka teks kustom.
Jika parameter Type diatur ke Keyword, nilai valid parameter Kategori Daftar adalah:
Block list: Jika teks yang dimoderasi cocok dengan istilah dalam pustaka teks, hasil moderasi bantuan mesin berisi parameter saran yang memiliki nilai blokir.
Review List: Jika teks yang dimoderasi cocok dengan istilah dalam pustaka teks, hasil moderasi bantuan mesin berisi parameter saran yang memiliki nilai tinjauan.
Filter List: Teks yang tidak cocok dengan istilah dalam pustaka teks dimoderasi.
Jika parameter Type diatur ke Similar Text, nilai valid untuk parameter List Category adalah:
Block list: Jika teks yang dimoderasi cocok dengan pola teks dalam pustaka teks, hasil moderasi bantuan mesin berisi parameter saran yang memiliki nilai blokir.
Review List: Jika teks yang dimoderasi cocok dengan pola teks dalam pustaka teks, hasil moderasi bantuan mesin berisi parameter saran yang memiliki nilai tinjauan.
Trust list: Jika teks yang dimoderasi cocok dengan pola teks dalam pustaka teks, hasil moderasi bantuan mesin berisi parameter saran yang memiliki nilai lewati.
bizType
Skenario bisnis tempat pustaka teks kustom berlaku. Anda dapat menentukan pustaka teks yang berbeda dalam permintaan API untuk memenuhi kebutuhan bisnis Anda. Misalnya, Anda dapat menggunakan parameter bizType untuk menentukan pustaka teks yang akan diterapkan dalam skenario moderasi tertentu. Parameter bizType berlaku dengan cara berikut:
Jika parameter bizType dalam permintaan moderasi diatur ke A, pustaka teks yang parameter bizType-nya diatur ke A digunakan untuk moderasi. Pustaka teks ini hanya dapat digunakan jika diaktifkan.
Dalam kasus lain, semua pustaka teks yang diaktifkan digunakan untuk moderasi.
Setelah pustaka teks dibuat, Anda dapat melihatnya dalam daftar pustaka teks.
Kelola istilah atau pola teks dalam pustaka teks.
Tab Custom Text Library menampilkan semua pustaka teks kustom. Pustaka yang ditandai dengan System dan dinamai dalam format SCENARIO_FEEDBACK_WHITE atau SCENARIO_FEEDBACK_BLACK adalah pustaka teks berbasis umpan balik. Misalnya, pustaka ANTISPAM_FEEDBACK_BLACK adalah daftar hitam yang terdiri dari pola teks yang ditambahkan oleh sistem dan digunakan untuk teks anti-spam.
Temukan pustaka istilah yang ingin Anda kelola dan klik Manage di kolom Tindakan.
Di halaman Text Libraries, kelola istilah dalam pustaka.
Halaman Text Libraries menampilkan semua istilah yang ditambahkan ke pustaka dan jumlah kali setiap istilah terdeteksi dalam tujuh hari terakhir di kolom Detected in Last Seven Days, tidak termasuk statistik pada hari saat ini.
CatatanAnda dapat menambahkan dan menghapus istilah. Operasi ini berlaku dalam waktu sekitar 15 menit.
Klik Add Keyword atau Import dan tambahkan istilah sesuai petunjuk.
Pilih satu atau lebih istilah yang tidak lagi Anda butuhkan dan klik Batch Delete untuk menghapus istilah tersebut. Anda juga dapat menemukan istilah tertentu dan klik Delete di kolom Tindakan untuk menghapus istilah tersebut.
Hapus, ubah, atau nonaktifkan pustaka teks
Di tab Custom Text Library, Anda dapat mengklik Delete, Edit, atau Disable di kolom Actions untuk menghapus, mengubah, atau menonaktifkan pustaka teks yang dikelola sendiri.