Komponen Filter Kata Kunci Sensitif LLM (DLC) dari Platform for AI (PAI) digunakan untuk menyaring teks yang mengandung kata kunci sensitif. File data Object Storage Service (OSS) input harus dalam format JSON Lines dan memenuhi persyaratan berikut: Setiap baris dalam file adalah objek JSON yang valid, tetapi file secara keseluruhan bukan objek JSON yang valid. Untuk informasi lebih lanjut, lihat Contoh.
Sumber daya komputasi yang didukung
Deskripsi algoritma
Komponen Filter Kata Kunci Sensitif LLM (DLC) memeriksa dan menyaring teks yang mengandung kata kunci sensitif. Komponen ini juga dapat mengembalikan kata kunci sensitif yang terdeteksi. Secara default, algoritma ini dapat mengenali lebih dari 12.000 kata kunci sensitif.
Konfigurasikan komponen
Pada halaman pipeline Machine Learning Designer, konfigurasikan parameter dari komponen LLM-Sensitive Keywords Filter (DLC).
Tab | Parameter | Diperlukan | Deskripsi | Nilai default | |
Pengaturan Bidang | Bidang Proses Target | Ya | Nama bidang yang ingin Anda proses. | Tidak tersedia | |
Direktori OSS untuk Menyimpan OutputData | Tidak | Direktori OSS tempat data yang dihasilkan disimpan. Jika Anda tidak menentukan parameter ini, jalur default ruang kerja akan digunakan. | Tidak tersedia | ||
File Kata Kunci Sensitif | Tidak | Path file kata kunci sensitif. Jika Anda membiarkan parameter ini kosong, daftar kata kunci sensitif default akan digunakan. Isi file harus dalam format "Kata kunci sensitif 1\nKata kunci sensitif 2\n...". Pisahkan beberapa kata kunci sensitif dengan line feed. | Daftar kata kunci sensitif default | ||
Pengaturan | Jumlah Proses | Tidak | Jumlah proses. | 8 | |
Pilih Grup Sumber Daya | Grup Sumber Daya Publik | Tidak | Tipe instans (CPU atau GPU), jumlah instans, dan virtual private cloud (VPC) yang ingin Anda gunakan. | Tidak tersedia | |
Grup sumber daya spesifikasi khusus | Tidak | Jumlah vCPU, memori, memori bersama, jumlah GPU, dan jumlah instans yang ingin Anda gunakan. | Tidak tersedia | ||
Durasi Maksimum Berjalan | Tidak | Periode maksimum waktu selama komponen dapat berjalan. Jika periode waktu ini terlampaui, tugas akan dihentikan. | Tidak tersedia | ||