全部产品
Search
文档中心

Content Moderation:Kelola pustaka teks kustom

更新时间:Jul 02, 2025

Content Moderation mendukung pustaka teks kustom. Anda dapat menggunakan pustaka ini untuk memastikan hasil moderasi sesuai dengan kebutuhan bisnis tertentu, seperti deteksi pelanggaran teks dalam gambar, iklan, anti-spam teks, file, dan audio. Anda juga dapat menentukan teks yang akan diblokir, dilewati, atau ditinjau di berbagai pustaka teks kustom.

Informasi latar belakang

Penting

Kami merekomendasikan agar Anda mengikuti petunjuk dalam topik ini untuk menggunakan pustaka teks kustom guna mencegah penambahan istilah yang tidak tepat yang dapat memengaruhi akurasi hasil moderasi.

Pustaka teks kustom mencakup dua jenis: pustaka teks berbasis umpan balik dan pustaka teks yang dikelola sendiri:

  • Pustaka teks berbasis umpan balik dibuat secara otomatis untuk menampung teks yang telah ditinjau. Secara default, pustaka ini dapat digunakan untuk memoderasi teks dalam semua skenario moderasi dengan tipe yang sama. Anda dapat mengelola teks dalam pustaka ini, tetapi tidak dapat melakukan operasi seperti menonaktifkan atau menghapusnya. Untuk informasi lebih lanjut tentang tinjauan manual, lihat Tinjau Hasil Moderasi Bantuan Mesin.

  • Pustaka teks yang dikelola sendiri adalah pustaka yang Anda buat untuk memoderasi teks dalam skenario atau jenis moderasi tertentu. Anda dapat mengelola teks serta melakukan operasi pada pustaka ini, seperti mengedit atau menonaktifkannya.

Catatan

Anda dapat membuat hingga 10 pustaka teks yang dikelola sendiri.

Topik ini menjelaskan cara mengelola pustaka teks kustom melalui konsol Content Moderation. Anda juga dapat mengelola pustaka teks kustom dengan memanggil operasi API atau menggunakan SDK Content Moderation. Untuk informasi lebih lanjut, lihat topik-topik berikut:

Jenis teks

Anda dapat menambahkan istilah dan pola teks ke pustaka teks kustom.

  • Istilah

    Istilah dirancang untuk menyesuaikan kata-kata dalam teks. Jika sebuah kalimat atau bagian teks mencakup istilah tertentu, istilah tersebut akan terpicu. Anda dapat menambahkan berbagai istilah sesuai dengan skenario bisnis yang berbeda.

    Dalam identifikasi Content Moderation, teknologi kata kunci dapat diterapkan pada deteksi pelanggaran dalam gambar dan teks anti-spam. Untuk informasi lebih lanjut tentang parameter relevan, lihat deskripsi parameter operasi moderasi dalam skenario yang berbeda. Parameter relevan dalam dua skenario ini mungkin sedikit berbeda.

    Anda dapat menambahkan operator logika AND (&) dan NOT (~) dalam istilah bahasa Cina. Contoh:

    • Istilah "A&B" ditambahkan. Jika sepotong teks mengandung A dan B, istilah tersebut terdeteksi.

    • Istilah "A~B" ditambahkan. Jika sepotong teks mengandung A tetapi tidak mengandung B, istilah tersebut terdeteksi.

    Catatan

    Jika Anda menambahkan kedua operator logika dalam sebuah istilah, operator AND (&) harus ditambahkan sebelum operator NOT (~). Misalnya, Anda dapat menambahkan "A&B~C" sebagai istilah, tetapi tidak dapat menambahkan "A~C&B" sebagai istilah.

  • Pola Teks

    Pola teks dirancang untuk membandingkan kesamaan antara kalimat atau potongan teks. Jika dua kalimat atau potongan teks sedikit berbeda tetapi menyampaikan makna yang sama, mereka dianggap memiliki kesamaan dekat. Content Moderation dapat menentukan apakah sepotong teks memiliki kesamaan dekat dengan pola teks dalam perpustakaan pola teks. Jika kesamaan mencapai tingkat tertentu, pola teks tersebut terdeteksi.

    Anda dapat menerapkan perpustakaan pola teks pada teks anti-spam. Content Moderation memungkinkan Anda menyesuaikan daftar hitam, daftar putih, dan daftar tinjauan untuk perpustakaan pola teks berdasarkan kebutuhan bisnis Anda. Daftar tinjauan berisi teks yang memerlukan tinjauan manual. Anda dapat mengelola pola teks terkait bisnis Anda dalam perpustakaan pola teks. Dalam hal ini, konten yang cocok dengan pola teks dapat disaring dalam teks anti-spam.

Batasan

Tipe

Item

Batasan

Pustaka teks yang dikelola sendiri

Jumlah

Mendukung maksimal 10 pustaka teks yang dikelola sendiri.

Pustaka teks yang dikelola sendiri

Panjang nama

Mendukung maksimal 20 karakter panjang untuk setiap nama pustaka.

Istilah

Tipe istilah

  • Istilah bahasa Cina didukung.

  • Huruf dan angka dapat digunakan sebagai istilah.

    Catatan

    Setiap kombinasi huruf dan angka dianggap sebagai satu kata selama pemisahan kata.

  • Kata atau frasa bahasa Inggris tidak dapat digunakan sebagai istilah.

Istilah

Jumlah istilah dalam pustaka teks

Mendukung maksimal 10.000 istilah dalam pustaka teks.

Istilah

Panjang istilah

Mendukung maksimal 50 karakter panjang untuk setiap istilah, termasuk operator logika.

Istilah

Pengkodean untuk istilah bahasa Cina

UTF-8.

Istilah

Format istilah

Karakter khusus berikut dalam bentuk full-width dan half-width tidak didukung:

Tanda at (@), tanda pagar (#), tanda dolar ($), tanda persen (%), tanda caret (^), tanda asterisk (*), tanda kurung (()), tanda kurung sudut (<>), garis miring (/), tanda tanya (?), koma (,), titik (.), titik koma (;), garis bawah (_), tanda tambah (+), tanda hubung (-), tanda sama dengan (=), tanda kutip tunggal ('), tanda kutip ganda ("), spasi, dan tab.

Pola teks

Panjang pola teks

Mendukung 20 hingga 4.000 karakter panjang untuk setiap pola teks.

Catatan

Jika teks yang ditambahkan ke pustaka terlalu panjang, kecocokan tidak valid mungkin terjadi. Kami merekomendasikan agar Anda menetapkan setiap pola teks maksimal 200 karakter panjang.

Pola teks

Jumlah pola teks dalam pustaka teks

Mendukung maksimal 10.000 pola teks dalam pustaka teks.

Pola teks

Pengkodean

UTF-8.

Pola teks

Isi teks

Memerlukan karakteristik semantik bahasa Cina yang jelas yang dapat diekstraksi. Jika sedikit karakteristik semantik yang dapat diidentifikasi dari pola teks, pola teks ini diabaikan.

Catatan

Pola teks yang terdiri dari huruf, angka, atau emotikon tanpa makna mungkin diabaikan.

Prosedur

  1. Masuk ke konsol Content Moderation.

  2. Di panel navigasi sisi kiri, pilih Machine audit V1.0 > Risk Libraries.

  3. Klik Create Text Library.

  4. Dalam kotak dialog Create Custom Text Library, atur parameter berdasarkan tabel Parameter untuk Membuat Pustaka Teks Kustom. Lalu, klik OK.

    Tabel 1. Parameter untuk Membuat Pustaka Teks Kustom

    Parameter

    Deskripsi

    Name

    Nama pustaka teks kustom. Anda dapat menetapkan nama yang sama untuk beberapa pustaka teks. Namun, kami merekomendasikan agar Anda menetapkan nama unik untuk setiap pustaka teks.

    Scene

    Skenario tempat pustaka teks berlaku. Nilai valid:

    • Text Anti-spam: text anti-spam where the value of the scene parameter contains antispam in API requests

    • Ad: image moderation where the value of the scene parameter contains ad in API requests

    Type

    Tipe teks dari pustaka teks. Nilai valid:

    • Keyword: mencocokkan teks yang dimoderasi yang mengandung istilah. Anda dapat mendeteksi lebih banyak teks berisiko dengan menggunakan istilah.

    • Similar Text: mencocokkan teks yang dimoderasi yang serupa dengan pola teks pada probabilitas tertentu. Anda dapat mendeteksi teks berisiko lebih akurat dengan menggunakan pola teks.

      Catatan

      Anda dapat menetapkan parameter ini ke Teks Serupa hanya jika parameter Scene diatur ke Text Anti-spam.

    Match Mode

    Mode pencocokan yang diterapkan pada pustaka teks kustom. Parameter ini diperlukan jika parameter Type diatur ke Keyword. Nilai valid:

    • Precise: mencocokkan teks yang dimoderasi yang mengandung istilah yang sama dalam pustaka teks.

    • Check after Preprocess Texts: memproses pra-pemrosesan istilah dan teks yang dimoderasi, lalu mencocokkan teks yang dimoderasi yang diproses pra-pemrosesan yang cocok dengan istilah yang diproses pra-pemrosesan. Istilah dan teks yang dimoderasi diproses pra-pemrosesan dengan cara berikut:

      • Mengubah huruf besar menjadi huruf kecil. Misalnya, jika teks yang dimoderasi adalah "bitCoin", istilah "bitcoin" terkena.

      • Mengubah karakter Cina tradisional menjadi karakter Cina sederhana.

      • Mengubah kata-kata serupa.

      Catatan

      Secara default, mode Periksa Setelah Pra-pemrosesan Teks dipilih untuk pustaka yang terdiri dari pola teks.

    List Category

    Kategori hasil moderasi yang dikembalikan berdasarkan pustaka teks kustom.

    • Jika parameter Type diatur ke Keyword, nilai valid parameter Kategori Daftar adalah:

      • Block list: Jika teks yang dimoderasi cocok dengan istilah dalam pustaka teks, hasil moderasi bantuan mesin berisi parameter saran yang memiliki nilai blokir.

      • Review List: Jika teks yang dimoderasi cocok dengan istilah dalam pustaka teks, hasil moderasi bantuan mesin berisi parameter saran yang memiliki nilai tinjauan.

      • Filter List: Teks yang tidak cocok dengan istilah dalam pustaka teks dimoderasi.

    • Jika parameter Type diatur ke Similar Text, nilai valid untuk parameter List Category adalah:

      • Block list: Jika teks yang dimoderasi cocok dengan pola teks dalam pustaka teks, hasil moderasi bantuan mesin berisi parameter saran yang memiliki nilai blokir.

      • Review List: Jika teks yang dimoderasi cocok dengan pola teks dalam pustaka teks, hasil moderasi bantuan mesin berisi parameter saran yang memiliki nilai tinjauan.

      • Trust list: Jika teks yang dimoderasi cocok dengan pola teks dalam pustaka teks, hasil moderasi bantuan mesin berisi parameter saran yang memiliki nilai lewati.

    bizType

    Skenario bisnis tempat pustaka teks kustom berlaku. Anda dapat menentukan pustaka teks yang berbeda dalam permintaan API untuk memenuhi kebutuhan bisnis Anda. Misalnya, Anda dapat menggunakan parameter bizType untuk menentukan pustaka teks yang akan diterapkan dalam skenario moderasi tertentu. Parameter bizType berlaku dengan cara berikut:

    • Jika parameter bizType dalam permintaan moderasi diatur ke A, pustaka teks yang parameter bizType-nya diatur ke A digunakan untuk moderasi. Pustaka teks ini hanya dapat digunakan jika diaktifkan.

    • Dalam kasus lain, semua pustaka teks yang diaktifkan digunakan untuk moderasi.

    Setelah pustaka teks dibuat, Anda dapat melihatnya dalam daftar pustaka teks.

  5. Kelola istilah atau pola teks dalam pustaka teks.

    Tab Custom Text Library menampilkan semua pustaka teks kustom. Pustaka yang ditandai dengan System dan dinamai dalam format SCENARIO_FEEDBACK_WHITE atau SCENARIO_FEEDBACK_BLACK adalah pustaka teks berbasis umpan balik. Misalnya, pustaka ANTISPAM_FEEDBACK_BLACK adalah daftar hitam yang terdiri dari pola teks yang ditambahkan oleh sistem dan digunakan untuk teks anti-spam.

    1. Temukan pustaka istilah yang ingin Anda kelola dan klik Manage di kolom Tindakan.

    2. Di halaman Text Libraries, kelola istilah dalam pustaka.

      Halaman Text Libraries menampilkan semua istilah yang ditambahkan ke pustaka dan jumlah kali setiap istilah terdeteksi dalam tujuh hari terakhir di kolom Detected in Last Seven Days, tidak termasuk statistik pada hari saat ini.

      Catatan

      Anda dapat menambahkan dan menghapus istilah. Operasi ini berlaku dalam waktu sekitar 15 menit.

      • Klik Add Keyword atau Import dan tambahkan istilah sesuai petunjuk.

      • Pilih satu atau lebih istilah yang tidak lagi Anda butuhkan dan klik Batch Delete untuk menghapus istilah tersebut. Anda juga dapat menemukan istilah tertentu dan klik Delete di kolom Tindakan untuk menghapus istilah tersebut.

Hapus, ubah, atau nonaktifkan pustaka teks

Di tab Custom Text Library, Anda dapat mengklik Delete, Edit, atau Disable di kolom Actions untuk menghapus, mengubah, atau menonaktifkan pustaka teks yang dikelola sendiri.