Aplikasi agen - Alibaba Cloud Model Studio

Model bahasa besar (LLM) tidak dapat langsung mengakses basis pengetahuan propietari atau mengambil informasi dinamis real-time. Untuk mengatasi hambatan ini, Alibaba Cloud Model Studio menyediakan aplikasi agen yang memungkinkan Anda mengintegrasikan LLM dengan tool eksternal tanpa menulis kode, sehingga memperluas kemampuan model tersebut.

Penting

Batasan Konsol: Hanya pengguna Edisi Internasional yang membuat aplikasi sebelum 21 April 2025 yang dapat mengakses tab Application Development, seperti yang ditunjukkan pada gambar berikut.
Tab ini mencakup fitur-fitur berikut: Aplikasi (aplikasi agen dan aplikasi alur kerja), Komponen (rekayasa prompt dan plug-in), serta Data (basis pengetahuan dan data aplikasi). Semua fitur ini masih dalam tahap pratinjau. Gunakan dengan hati-hati di lingkungan produksi.
Batasan panggilan API: Hanya pengguna Edisi Internasional yang membuat aplikasi sebelum 21 April 2025 yang dapat memanggil API data aplikasi, basis pengetahuan, dan rekayasa prompt.

Prinsip dasar

Agen digerakkan oleh prompt dan menyelesaikan tugas kompleks dengan mengoordinasikan berbagai kemampuan eksternal. Setelah menerima permintaan, LLM melakukan pengenalan niat dan perencanaan tugas, lalu mengambil keputusan secara otonom serta memanggil satu atau beberapa kemampuan eksternal untuk mengeksekusi tugas tersebut. Terakhir, LLM mengintegrasikan informasi untuk menghasilkan respons.

Agen Model Studio mendukung kemampuan inti berikut:

Basis pengetahuan: Menghubungkan ke basis pengetahuan eksternal, memungkinkan aplikasi menjawab pertanyaan berdasarkan data privat dan mengatasi keterbatasan LLM dalam mengakses informasi spesifik.
Plug-in: Memanggil tool efisiensi yang telah dibuat sebelumnya di platform, seperti tool untuk eksekusi kode, generasi citra, dan kueri cuaca.

Mulai cepat

Buat agen dasar

Buka halaman Aplikasi Saya di konsol Model Studio. Klik + Create Application. Pada tab Agent Application, klik Create Now.
Pada halaman konfigurasi aplikasi, pilih model dari menu drop-down pemilihan model, misalnya Qwen-Plus. Anda dapat mempertahankan pengaturan default untuk parameter lain jika tidak memiliki persyaratan khusus.
Setelah aplikasi dibuat, masukkan Hello di kotak dialog sebelah kiri untuk mengujinya.

Kemampuan agen

Aplikasi agen Alibaba Cloud Model Studio dapat diperluas dengan memilih model, mengoptimalkan prompt sistem, menambahkan RAG, memanggil plug-in serta layanan MCP.

Model

Model adalah inti yang mendorong agen untuk berpikir, melakukan inferensi, dan mengambil keputusan. Agen Model Studio mendukung model Qwen.

Pilih model
Dari menu drop-down pemilihan model, pilih model, misalnya Qwen-Plus.
Klik More Models untuk memilih model lain.
Konfigurasikan parameter
Klik di sebelah kanan menu drop-down model untuk memilih dan mengonfigurasi parameter. Parameter yang didukung adalah sebagai berikut:
1. Panjang Respons Maksimum: Batas panjang untuk generasi model, tidak termasuk prompt. Panjang maksimum yang diizinkan bervariasi tergantung model.
2. Putaran Konteks: Menetapkan jumlah maksimum putaran percakapan historis yang dimasukkan ke model. Semakin banyak putaran yang disertakan, semakin kuat relevansi percakapan.
3. temperature: Mengontrol tingkat keacakan dan keragaman generasi. Nilai yang lebih tinggi menghasilkan keragaman lebih besar, sedangkan nilai yang lebih rendah menghasilkan konsistensi lebih tinggi. Nilainya berkisar antara [0, 2).
4. enable_thinking: Menentukan apakah mode berpikir diaktifkan. Beberapa model yang tidak mendukung mode berpikir tidak memungkinkan Anda mengonfigurasi parameter enable_thinking.
  Setelah Anda mengaktifkan mode berpikir, model akan melakukan lebih banyak penalaran internal dan pemrosesan konteks saat menghasilkan respons, yang meningkatkan konsumsi token.

Prompt sistem

Prompt sistem adalah instruksi meta yang telah ditetapkan untuk agen. Prompt ini menetapkan peran agen, kode etik, dan batasan kemampuan untuk memastikan konsistensi, kendali, serta kepatuhan terhadap tugas selama interaksi.

Konfigurasikan prompt
Tetapkan prompt sistem menjadi Harap jawab pertanyaan saya dengan gaya "One Hundred Years of Solitude". Berikut adalah perbandingan hasilnya:
- Tanpa prompt sistem:
- Mengonfigurasi prompt sistem

Basis pengetahuan

Retrieval-augmented generation (RAG) memungkinkan agen mengkueri basis pengetahuan eksternal dan menggunakan informasi yang paling relevan sebagai dasar langsung untuk menghasilkan jawaban. Saat menangani pengetahuan privat atau tanya jawab domain vertikal, RAG dapat secara signifikan meningkatkan akurasi jawaban agen dan mengurangi halusinasi. Untuk informasi lebih lanjut, lihat Basis pengetahuan (RAG).

Teks yang diambil oleh RAG juga menempati jendela konteks model bahasa besar. Oleh karena itu, Anda perlu menyesuaikan strategi pengambilan dan panjang teks sesuai kebutuhan agar jendela konteks dimanfaatkan secara optimal dan tidak melebihi batasnya.

Plug-in

Dengan memanggil plug-in, aplikasi agen dapat menjalankan tugas tertentu, seperti eksekusi kode, pencarian web, dan generasi teks-ke-citra. Model Studio menyediakan berbagai plug-in resmi dan mendukung penambahan plug-in kustom. Untuk informasi lebih lanjut, lihat Ikhtisar plug-in.

Interaksi agen

Percakapan teks

Percakapan teks adalah metode interaksi inti aplikasi agen, memberikan pengalaman percakapan multi-putaran yang cerdas dan personal.

Percakapan teks mendukung dua metode input utama:

Input teks: Masukkan teks untuk berdialog dengan agen.
Unggah file: Unggah file sebagai lampiran untuk agen. Berbagai format, seperti dokumen, citra, video, dan audio, didukung.

Publikasikan dan panggil agen

Agen Model Studio mendukung panggilan eksternal melalui API. Agen juga mendukung publikasi satu-klik ke platform pihak ketiga dan integrasi ke proses bisnis lain melalui komponen.

Publikasikan aplikasi

Penting

Publikasi aplikasi merupakan prasyarat untuk semua panggilan dan integrasi aplikasi agen selanjutnya.

Klik tombol Publish di pojok kanan atas halaman manajemen aplikasi agen, lalu klik Confirm Publish untuk menyelesaikan publikasi aplikasi.

Jika aplikasi bukan pertama kali dipublikasikan, jendela pop-up akan menampilkan perubahan sejak publikasi terakhir.

Catatan

Jika aplikasi dibuat oleh akun RAM, pastikan Anda memiliki izin peran terkait layanan ram:CreateServiceLinkedRole sebelum mempublikasikan. Untuk informasi lebih lanjut, lihat Peran Terkait Layanan.

Panggil melalui API

Pada tab Publish Channels aplikasi agen, klik View API di sebelah kanan API Call untuk melihat metode memanggil aplikasi agen melalui API.

Ganti YOUR_API_KEY dengan Kunci API Model Studio Anda untuk memanggil API.

Manajemen agen

Hapus dan salin

Anda dapat menemukan kartu aplikasi yang telah dipublikasikan di Application Management. Di menu More > Copy Application/Delete Application, Anda dapat menghapus atau menyalin agen, atau mengubah nama aplikasi.

Manajemen versi

Melalui fitur manajemen versi, Anda dapat mengedit deskripsi versi historis atau memilih dan menggunakan versi historis yang sebelumnya telah dipublikasikan.

Pada tab Application Configuration aplikasi agen, klik Version Management di pojok kanan atas bilah navigasi atas.
Pada daftar versi historis, pilih versi target:
- Untuk mengubah informasi versi, arahkan kursor mouse ke ikon lalu klik. Pada kotak dialog Edit Version Description, lakukan perubahan sesuai kebutuhan, lalu klik OK.
- Untuk menggunakan versi historis ini, klik Overwrite Current Draft, lalu klik Confirm pada kotak dialog konfirmasi.
  Konten versi historis ini akan menimpa konten draf saat ini.

Penagihan

Penagihan untuk fitur agen terutama mencakup aspek-aspek berikut:

Panggilan model
Agen dikenai biaya panggilan model. Biaya spesifik tergantung pada jenis model dan jumlah token input serta output.
Untuk jenis model spesifik dan aturan penagihan yang sesuai, lihat Model.
Basis pengetahuan
1. Fitur basis pengetahuan gratis untuk waktu terbatas.
2. Segmen teks yang diambil dari basis pengetahuan meningkatkan jumlah token input model, yang dapat menyebabkan peningkatan biaya inferensi (panggilan) model. Untuk informasi lebih lanjut, lihat Penagihan basis pengetahuan.

Model yang didukung

Catatan

Pembaruan data mungkin tertunda. Daftar model yang didukung mengacu pada yang ditampilkan dalam aplikasi agen.

FAQ

Bagaimana cara penagihan aplikasi Model Studio?

Membuat aplikasi tidak dikenai biaya. Namun, jika Anda memanggil aplikasi untuk tanya jawab, biaya panggilan model akan dikenakan berdasarkan jenis model yang dipanggil.

Saya telah mengonfigurasi basis pengetahuan, tetapi jawaban agen tidak terkait dengan konten basis pengetahuan. Bagaimana cara mengatasinya?

Pertama, lakukan uji hit basis pengetahuan untuk memeriksa skor kemiripan antara pertanyaan dan konten basis pengetahuan. Jika skornya rendah, coba optimalkan konfigurasi pengambilan untuk memastikan model memprioritaskan pengambilan jawaban dari basis pengetahuan.
Tambahkan batasan dalam pengaturan keterampilan prompt, yang mengharuskan model hanya menjawab berdasarkan konten basis pengetahuan dan menghindari penggunaan pengetahuan bawaan model bahasa besar untuk menghasilkan balasan.
Jika masalah tetap berlanjut, kemungkinan disebabkan oleh karakteristik model itu sendiri. Kami menyarankan mencoba model lain untuk mendapatkan output yang lebih stabil.

Apakah ada batas timeout untuk plug-in kustom?

Ya, ada. Batas timeout-nya adalah 5 detik.

Bisakah saya membuat aplikasi agen melalui API?

Anda dapat menggunakan API Asisten untuk membuat aplikasi model bahasa besar, yang fungsinya mirip dengan aplikasi agen. Namun, aplikasi yang dibuat melalui API Asisten tidak dapat dikelola di konsol. Untuk informasi lebih lanjut, lihat Dokumentasi API Asisten.