Alibaba Cloud AI Guardrails merupakan solusi terdepan dalam perlindungan aplikasi AI dan keamanan konten. Dibangun berdasarkan pengalaman teknologi Alibaba selama bertahun-tahun dan terintegrasi secara mendalam dengan model besar Tongyi, layanan ini menyediakan kerangka kerja tata kelola keamanan yang komprehensif untuk era AI serta sistem moderasi yang andal untuk konten yang dibuat pengguna (UGC). Berbekal pengalaman luas dalam tata kelola konten yang dihasilkan AI (AIGC) dan UGC di berbagai industri—seperti e-commerce, media sosial, keuangan, media, pendidikan, gaming, model dasar, dan aplikasi AI—layanan ini menawarkan solusi satu atap untuk mengidentifikasi risiko dan melindungi konten multimodal, termasuk teks, gambar, video, audio, dan dokumen.
Fitur
AI Guardrails memanfaatkan pengalaman teknis Alibaba selama bertahun-tahun dan terintegrasi secara mendalam dengan model besar Tongyi. Layanan ini dilatih menggunakan set data dalam jumlah besar, menjalani berbagai evaluasi, dan terus diperbarui. Pendekatan siap pakai ini membantu perusahaan dan pengembang menerapkan moderasi konten otomatis serta perlindungan aplikasi AI dengan cepat. Layanan ini juga mendukung kebutuhan kustomisasi, seperti agen moderasi kustom, penyesuaian model algoritma, optimasi untuk target deteksi tertentu, dan penyetelan ambang batas deteksi.
Produk AI Guardrails mencakup dua penawaran: Guardrails dan Content Moderation.
Guardrails menyediakan sistem perlindungan all-in-one untuk aplikasi AI. Layanan ini mendukung berbagai kemampuan deteksi risiko, konfigurasi perlindungan fleksibel, dan berbagai metode integrasi.
Kemampuan deteksi risiko
Layanan ini mendeteksi berbagai jenis risiko, termasuk konten tidak sesuai, data sensitif, serangan prompt, file berbahaya, URL berbahaya, halusinasi model, dan crawler prompt. Layanan ini juga mendukung penyisipan Watermark digital pada konten yang dihasilkan.
Konfigurasi perlindungan kustom
Anda dapat menyesuaikan pengaturan deteksi risiko dalam konfigurasi perlindungan Anda, termasuk item deteksi, ambang batas risiko, dan daftar kata filter.
Metode integrasi
Layanan ini mendukung berbagai metode integrasi, termasuk API, AI Gateway, Web Application Firewall (WAF), model Model Studio, agen Model Studio, agen Dify, dan Plugin OpenClaw.
Content Moderation menyediakan layanan moderasi multimodal untuk konten yang dibuat pengguna (UGC). Fitur utama Content Moderation meliputi API moderasi konten, dan Konsol.
API moderasi konten
API moderasi konten menggunakan operasi Alibaba Cloud untuk memindai teks, gambar, video, audio, dan dokumen guna mengidentifikasi risiko seperti pornografi, konten sensitif politik, kekerasan, darah, pelanggaran iklan, spam, konten tidak pantas, dan konten yang dihasilkan AI. API ini cocok untuk platform daring dengan konten yang dapat diakses publik, seperti situs video, platform streaming langsung, media sosial, situs media, komunitas vertikal, forum, situs e-commerce, layanan penyimpanan, dan platform CDN.
Konsol
Untuk kedua metode deteksi tersebut, Content Moderation menyediakan Konsol Alibaba Cloud untuk statistik data, analisis hasil moderasi, konfigurasi kontrol personalisasi, dan manajemen pustaka risiko. Konsol ini ideal bagi pengguna yang memerlukan kemampuan analitis, deteksi berbeda di berbagai skenario, serta kontrol manajemen kustom.
Kasus penggunaan
Guardrails dirancang untuk kasus penggunaan AI, sedangkan Content Moderation dirancang untuk kasus penggunaan UGC.
Kasus penggunaan umum untuk Guardrails meliputi:
Prompt pengguna yang dikirimkan ke model AI generatif.
Konten multimodal yang dihasilkan oleh AI generatif, termasuk teks, gambar, dan video.
Pemindaian dan pembersihan korpus pelatihan untuk AI generatif.
Deteksi risiko untuk input dan output Agen AI.
Deteksi runtime untuk produk sejenis OpenClaw.
Kasus penggunaan umum untuk Content Moderation meliputi:
Informasi profil pengguna, seperti nama panggilan, avatar, dan bio.
Postingan dan komentar di situs komunitas.
Obrolan dalam game, termasuk saluran publik, obrolan grup, dan pesan pribadi.
Moderasi konten untuk frame video dan audio dalam streaming langsung dan Video sesuai permintaan (VOD).
Pemesanan, ulasan, dan komunikasi dalam aplikasi logistik dan layanan antar-jemput.
Harga
AI Guardrails mendukung metode penagihan pay-as-you-go dan paket sumber daya. Anda juga dapat membeli paket ekspansi QPS untuk meningkatkan kapasitas queries per second (QPS) Anda.
Untuk informasi harga Guardrails, lihat Ikhtisar aktivasi dan penagihan.
Untuk informasi harga Content Moderation, lihat Aktivasi dan penagihan.
Perbandingan Guardrails dan Content Moderation
AI Guardrails memiliki dua penawaran: Guardrails untuk skenario AI dan Content Moderation untuk skenario UGC. Guardrails memberikan perlindungan komprehensif untuk aplikasi AI, sedangkan Content Moderation memastikan keamanan dan kepatuhan konten yang dibuat pengguna.
Saat kasus penggunaan Anda jelas terdefinisi, gunakan layanan yang sesuai:
Gunakan Guardrails untuk skenario AI murni, seperti generasi teks-ke-teks, pemahaman gambar, gambar berbasis AI, dan agen moderasi.
Gunakan Content Moderation untuk skenario yang melibatkan konten buatan pengguna, seperti postingan di aplikasi sosial, obrolan pemain dalam game, komentar streaming langsung, dan daftar produk di platform e-commerce.
Untuk skenario hibrida, pilih layanan berdasarkan kasus penggunaan utama:
Pada aplikasi sosial tempat pengguna mengunggah gambar yang dihasilkan AI, aktivitas utamanya adalah pengguna mempublikasikan konten mereka sendiri. Dalam kasus ini, Content Moderation lebih sesuai.
Pada aplikasi obrolan pendamping AI tempat pengguna memasukkan teks dan AI memberikan respons, skenarionya adalah aplikasi AI. Dalam kasus ini, Guardrails lebih sesuai.
Content Moderation 2.0 vs. 1.0
Content Moderation 2.0 merupakan peningkatan dari versi 1.0, menawarkan skenario bisnis pra-konfigurasi serta peningkatan performa, kelengkapan label, fleksibilitas konfigurasi, dan harga.
Perbandingan kemampuan
Item | Content Moderation 2.0 | Content Moderation 1.0 |
Metode penagihan dan harga |
Catatan Untuk detail harga Content Moderation 2.0, lihat Harga Content Moderation. |
Catatan Untuk detail harga Content Moderation 1.0, lihat Harga Content Moderation. |
Konfigurasi moderasi | Cakupan moderasi (10+ kategori utama, 100+ subkategori) Pustaka kustom | Cakupan moderasi (5+ kategori utama, 50+ subkategori) Pustaka kustom |
Kapasitas default |
|
|
Konten yang dimoderasi dan skenario bisnis | Modalitas: Gambar, teks, audio, video Skenario bisnis preset: Termasuk moderasi garis dasar umum, moderasi hiburan sosial dan streaming langsung, serta moderasi media audio visual | Modalitas: Gambar, teks, video Skenario bisnis preset: Moderasi garis dasar umum |
Hasil moderasi |
|
|
Aktivasi dan penagihan
Untuk detail cara mengaktifkan dan membayar Content Moderation 2.0, lihat Aktivasi dan penagihan.
Untuk detail cara mengaktifkan dan membayar Content Moderation 1.0, lihat Aktivasi dan penagihan.
Item | Content Moderation 2.0 | Content Moderation 1.0 |
Pay-as-you-go | Penagihan pay-as-you-go Content Moderation 2.0 diukur dan ditagih berdasarkan jenis konten berbeda (seperti gambar, teks, dan voice) serta volume deteksi. Saat Anda mendeteksi beberapa skenario risiko untuk konten yang sama, biayanya 50% hingga 70% lebih rendah dibandingkan versi 1.0. | Penagihan pay-as-you-go Content Moderation 1.0 bergantung pada berbagai faktor, termasuk jenis konten (seperti gambar, teks, video), skenario moderasi (seperti deteksi pornografi atau spam), tier volume pemindaian harian, saran penanganan (review, block, atau pass), dan Wilayah layanan (seperti Tiongkok (Shanghai)). |