All Products
Search
Document Center

AI Guardrails:Ikhtisar produk AI Guardrails

Last Updated:Mar 27, 2026

Alibaba Cloud AI Guardrails merupakan solusi terdepan dalam perlindungan aplikasi AI dan keamanan konten. Dibangun berdasarkan pengalaman teknologi Alibaba selama bertahun-tahun dan terintegrasi secara mendalam dengan model besar Tongyi, layanan ini menyediakan kerangka kerja tata kelola keamanan yang komprehensif untuk era AI serta sistem moderasi yang andal untuk konten yang dibuat pengguna (UGC). Berbekal pengalaman luas dalam tata kelola konten yang dihasilkan AI (AIGC) dan UGC di berbagai industri—seperti e-commerce, media sosial, keuangan, media, pendidikan, gaming, model dasar, dan aplikasi AI—layanan ini menawarkan solusi satu atap untuk mengidentifikasi risiko dan melindungi konten multimodal, termasuk teks, gambar, video, audio, dan dokumen.

Fitur

AI Guardrails memanfaatkan pengalaman teknis Alibaba selama bertahun-tahun dan terintegrasi secara mendalam dengan model besar Tongyi. Layanan ini dilatih menggunakan set data dalam jumlah besar, menjalani berbagai evaluasi, dan terus diperbarui. Pendekatan siap pakai ini membantu perusahaan dan pengembang menerapkan moderasi konten otomatis serta perlindungan aplikasi AI dengan cepat. Layanan ini juga mendukung kebutuhan kustomisasi, seperti agen moderasi kustom, penyesuaian model algoritma, optimasi untuk target deteksi tertentu, dan penyetelan ambang batas deteksi.

Produk AI Guardrails mencakup dua penawaran: Guardrails dan Content Moderation.

  • Guardrails menyediakan sistem perlindungan all-in-one untuk aplikasi AI. Layanan ini mendukung berbagai kemampuan deteksi risiko, konfigurasi perlindungan fleksibel, dan berbagai metode integrasi.

    • Kemampuan deteksi risiko

      Layanan ini mendeteksi berbagai jenis risiko, termasuk konten tidak sesuai, data sensitif, serangan prompt, file berbahaya, URL berbahaya, halusinasi model, dan crawler prompt. Layanan ini juga mendukung penyisipan Watermark digital pada konten yang dihasilkan.

    • Konfigurasi perlindungan kustom

      Anda dapat menyesuaikan pengaturan deteksi risiko dalam konfigurasi perlindungan Anda, termasuk item deteksi, ambang batas risiko, dan daftar kata filter.

    • Metode integrasi

      Layanan ini mendukung berbagai metode integrasi, termasuk API, AI Gateway, Web Application Firewall (WAF), model Model Studio, agen Model Studio, agen Dify, dan Plugin OpenClaw.

  • Content Moderation menyediakan layanan moderasi multimodal untuk konten yang dibuat pengguna (UGC). Fitur utama Content Moderation meliputi API moderasi konten, dan Konsol.

    • API moderasi konten

      API moderasi konten menggunakan operasi Alibaba Cloud untuk memindai teks, gambar, video, audio, dan dokumen guna mengidentifikasi risiko seperti pornografi, konten sensitif politik, kekerasan, darah, pelanggaran iklan, spam, konten tidak pantas, dan konten yang dihasilkan AI. API ini cocok untuk platform daring dengan konten yang dapat diakses publik, seperti situs video, platform streaming langsung, media sosial, situs media, komunitas vertikal, forum, situs e-commerce, layanan penyimpanan, dan platform CDN.

    • Konsol

      Untuk kedua metode deteksi tersebut, Content Moderation menyediakan Konsol Alibaba Cloud untuk statistik data, analisis hasil moderasi, konfigurasi kontrol personalisasi, dan manajemen pustaka risiko. Konsol ini ideal bagi pengguna yang memerlukan kemampuan analitis, deteksi berbeda di berbagai skenario, serta kontrol manajemen kustom.

Kasus penggunaan

Guardrails dirancang untuk kasus penggunaan AI, sedangkan Content Moderation dirancang untuk kasus penggunaan UGC.

  • Kasus penggunaan umum untuk Guardrails meliputi:

    • Prompt pengguna yang dikirimkan ke model AI generatif.

    • Konten multimodal yang dihasilkan oleh AI generatif, termasuk teks, gambar, dan video.

    • Pemindaian dan pembersihan korpus pelatihan untuk AI generatif.

    • Deteksi risiko untuk input dan output Agen AI.

    • Deteksi runtime untuk produk sejenis OpenClaw.

  • Kasus penggunaan umum untuk Content Moderation meliputi:

    • Informasi profil pengguna, seperti nama panggilan, avatar, dan bio.

    • Postingan dan komentar di situs komunitas.

    • Obrolan dalam game, termasuk saluran publik, obrolan grup, dan pesan pribadi.

    • Moderasi konten untuk frame video dan audio dalam streaming langsung dan Video sesuai permintaan (VOD).

    • Pemesanan, ulasan, dan komunikasi dalam aplikasi logistik dan layanan antar-jemput.

Harga

AI Guardrails mendukung metode penagihan pay-as-you-go dan paket sumber daya. Anda juga dapat membeli paket ekspansi QPS untuk meningkatkan kapasitas queries per second (QPS) Anda.

Perbandingan Guardrails dan Content Moderation

AI Guardrails memiliki dua penawaran: Guardrails untuk skenario AI dan Content Moderation untuk skenario UGC. Guardrails memberikan perlindungan komprehensif untuk aplikasi AI, sedangkan Content Moderation memastikan keamanan dan kepatuhan konten yang dibuat pengguna.

  • Saat kasus penggunaan Anda jelas terdefinisi, gunakan layanan yang sesuai:

    • Gunakan Guardrails untuk skenario AI murni, seperti generasi teks-ke-teks, pemahaman gambar, gambar berbasis AI, dan agen moderasi.

    • Gunakan Content Moderation untuk skenario yang melibatkan konten buatan pengguna, seperti postingan di aplikasi sosial, obrolan pemain dalam game, komentar streaming langsung, dan daftar produk di platform e-commerce.

  • Untuk skenario hibrida, pilih layanan berdasarkan kasus penggunaan utama:

    • Pada aplikasi sosial tempat pengguna mengunggah gambar yang dihasilkan AI, aktivitas utamanya adalah pengguna mempublikasikan konten mereka sendiri. Dalam kasus ini, Content Moderation lebih sesuai.

    • Pada aplikasi obrolan pendamping AI tempat pengguna memasukkan teks dan AI memberikan respons, skenarionya adalah aplikasi AI. Dalam kasus ini, Guardrails lebih sesuai.

Content Moderation 2.0 vs. 1.0

Content Moderation 2.0 merupakan peningkatan dari versi 1.0, menawarkan skenario bisnis pra-konfigurasi serta peningkatan performa, kelengkapan label, fleksibilitas konfigurasi, dan harga.

Perbandingan kemampuan

Item

Content Moderation 2.0

Content Moderation 1.0

Metode penagihan dan harga

  • Gambar

    Rumus penagihan: Biaya = Jumlah gambar × Jumlah skenario bisnis × Harga satuan per skenario bisnis

    pay-as-you-go: Mulai dari $0,60 per 1.000 gambar, sekitar 48% dari harga versi 1.0

  • Teks

    Rumus penagihan: Biaya = Jumlah entri teks × Jumlah skenario bisnis × Harga satuan per skenario bisnis

    pay-as-you-go: Mulai dari $0,30 per 1.000 entri, sekitar 60% dari harga versi 1.0

  • Audio

    Rumus penagihan: Biaya = Durasi audio dalam menit × Jumlah skenario bisnis × Harga satuan per skenario bisnis

    pay-as-you-go: $9 per 1.000 menit

  • Video

    Rumus penagihan: Biaya = (Jumlah frame yang diambil × Jumlah skenario bisnis × Harga satuan per skenario bisnis) + (Durasi video dalam menit × Jumlah skenario audio × Harga satuan per skenario audio)

    pay-as-you-go: Mulai dari $0,60 per 1.000 frame untuk frame video yang diambil, dan $8,10 per 1.000 menit (sekitar 34% dari harga versi 1.0) untuk audio dari video

Catatan

Untuk detail harga Content Moderation 2.0, lihat Harga Content Moderation.

  • Gambar

    Rumus penagihan: Biaya = Jumlah gambar × Jumlah skenario risiko × Harga satuan per skenario

  • Teks

    Rumus penagihan: Biaya = Jumlah entri teks × Jumlah skenario risiko × Harga satuan per skenario

  • Video

    Rumus penagihan: Biaya = (Jumlah frame yang diambil × Jumlah skenario risiko × Harga satuan per skenario risiko)

Catatan

Untuk detail harga Content Moderation 1.0, lihat Harga Content Moderation.

Konfigurasi moderasi

Cakupan moderasi (10+ kategori utama, 100+ subkategori)

Pustaka kustom

Cakupan moderasi (5+ kategori utama, 50+ subkategori)

Pustaka kustom

Kapasitas default

  • Gambar: 50 QPS untuk edisi model besar, 100 QPS untuk edisi standar

  • Teks: 50 QPS untuk edisi model besar, 100 QPS untuk edisi standar

  • Audio: 50 tugas konkuren

  • Video: 50 tugas konkuren

  • Dokumen: 20 tugas konkuren

  • Gambar: 50 QPS

  • Teks: 100 QPS

  • Video: 20 tugas konkuren

Konten yang dimoderasi dan skenario bisnis

Modalitas: Gambar, teks, audio, video

Skenario bisnis preset: Termasuk moderasi garis dasar umum, moderasi hiburan sosial dan streaming langsung, serta moderasi media audio visual

Modalitas: Gambar, teks, video

Skenario bisnis preset: Moderasi garis dasar umum

Hasil moderasi

  • Label yang dapat diinterpretasikan (50+, beberapa label pelanggaran dapat dikembalikan secara bersamaan)

  • Skor kepercayaan

  • Label yang dapat diinterpretasikan (40+, hanya satu label pelanggaran yang dapat dikembalikan dalam satu waktu)

  • Saran penanganan

Aktivasi dan penagihan

Item

Content Moderation 2.0

Content Moderation 1.0

Pay-as-you-go

Penagihan pay-as-you-go Content Moderation 2.0 diukur dan ditagih berdasarkan jenis konten berbeda (seperti gambar, teks, dan voice) serta volume deteksi. Saat Anda mendeteksi beberapa skenario risiko untuk konten yang sama, biayanya 50% hingga 70% lebih rendah dibandingkan versi 1.0.

Penagihan pay-as-you-go Content Moderation 1.0 bergantung pada berbagai faktor, termasuk jenis konten (seperti gambar, teks, video), skenario moderasi (seperti deteksi pornografi atau spam), tier volume pemindaian harian, saran penanganan (review, block, atau pass), dan Wilayah layanan (seperti Tiongkok (Shanghai)).