Model bahasa besar (LLM) tidak dapat langsung mengakses basis pengetahuan propietari atau mengambil informasi dinamis real-time. Untuk mengatasi hambatan ini, Alibaba Cloud Model Studio menyediakan aplikasi agen yang memungkinkan Anda mengintegrasikan LLM dengan tool eksternal tanpa menulis kode, sehingga memperluas kemampuan model tersebut.
Batasan Konsol: Hanya pengguna Edisi Internasional yang membuat aplikasi sebelum 21 April 2025 yang dapat mengakses tab Application Development, seperti yang ditunjukkan pada gambar berikut.
Tab ini mencakup fitur-fitur berikut: Aplikasi (aplikasi agen dan aplikasi alur kerja), Komponen (rekayasa prompt dan plug-in), serta Data (basis pengetahuan dan data aplikasi). Semua fitur ini masih dalam tahap pratinjau. Gunakan dengan hati-hati di lingkungan produksi.

Batasan panggilan API: Hanya pengguna Edisi Internasional yang membuat aplikasi sebelum 21 April 2025 yang dapat memanggil API data aplikasi, basis pengetahuan, dan rekayasa prompt.
Prinsip dasar
Agen digerakkan oleh prompt dan menyelesaikan tugas kompleks dengan mengoordinasikan berbagai kemampuan eksternal. Setelah menerima permintaan, LLM melakukan pengenalan niat dan perencanaan tugas, lalu mengambil keputusan secara otonom serta memanggil satu atau beberapa kemampuan eksternal untuk mengeksekusi tugas tersebut. Terakhir, LLM mengintegrasikan informasi untuk menghasilkan respons.
Agen Model Studio mendukung kemampuan inti berikut:
Basis pengetahuan: Menghubungkan ke basis pengetahuan eksternal, memungkinkan aplikasi menjawab pertanyaan berdasarkan data privat dan mengatasi keterbatasan LLM dalam mengakses informasi spesifik.
Plug-in: Memanggil tool efisiensi yang telah dibuat sebelumnya di platform, seperti tool untuk eksekusi kode, generasi citra, dan kueri cuaca.
Mulai cepat
Buat agen dasar
Buka halaman Aplikasi Saya di konsol Model Studio. Klik + Create Application. Pada tab Agent Application, klik Create Now.

Pada halaman konfigurasi aplikasi, pilih model dari menu drop-down pemilihan model, misalnya
Qwen-Plus. Anda dapat mempertahankan pengaturan default untuk parameter lain jika tidak memiliki persyaratan khusus.
Setelah aplikasi dibuat, masukkan
Hellodi kotak dialog sebelah kiri untuk mengujinya.
Kemampuan agen
Aplikasi agen Alibaba Cloud Model Studio dapat diperluas dengan memilih model, mengoptimalkan prompt sistem, menambahkan RAG, memanggil plug-in serta layanan MCP.
Model
Model adalah inti yang mendorong agen untuk berpikir, melakukan inferensi, dan mengambil keputusan. Agen Model Studio mendukung model Qwen.
Pilih model
Dari menu drop-down pemilihan model, pilih model, misalnya
Qwen-Plus.
Klik More Models untuk memilih model lain.

Konfigurasikan parameter
Klik
di sebelah kanan menu drop-down model untuk memilih dan mengonfigurasi parameter. Parameter yang didukung adalah sebagai berikut:Panjang Respons Maksimum: Batas panjang untuk generasi model, tidak termasuk prompt. Panjang maksimum yang diizinkan bervariasi tergantung model.
Putaran Konteks: Menetapkan jumlah maksimum putaran percakapan historis yang dimasukkan ke model. Semakin banyak putaran yang disertakan, semakin kuat relevansi percakapan.
temperature: Mengontrol tingkat keacakan dan keragaman generasi. Nilai yang lebih tinggi menghasilkan keragaman lebih besar, sedangkan nilai yang lebih rendah menghasilkan konsistensi lebih tinggi. Nilainya berkisar antara [0, 2).
enable_thinking: Menentukan apakah mode berpikir diaktifkan. Beberapa model yang tidak mendukung mode berpikir tidak memungkinkan Anda mengonfigurasi parameter enable_thinking.
Setelah Anda mengaktifkan mode berpikir, model akan melakukan lebih banyak penalaran internal dan pemrosesan konteks saat menghasilkan respons, yang meningkatkan konsumsi token.
Prompt sistem
Prompt sistem adalah instruksi meta yang telah ditetapkan untuk agen. Prompt ini menetapkan peran agen, kode etik, dan batasan kemampuan untuk memastikan konsistensi, kendali, serta kepatuhan terhadap tugas selama interaksi.

Konfigurasikan prompt
Tetapkan prompt sistem menjadi
Harap jawab pertanyaan saya dengan gaya "One Hundred Years of Solitude". Berikut adalah perbandingan hasilnya:Tanpa prompt sistem:

Mengonfigurasi prompt sistem

Basis pengetahuan
Retrieval-augmented generation (RAG) memungkinkan agen mengkueri basis pengetahuan eksternal dan menggunakan informasi yang paling relevan sebagai dasar langsung untuk menghasilkan jawaban. Saat menangani pengetahuan privat atau tanya jawab domain vertikal, RAG dapat secara signifikan meningkatkan akurasi jawaban agen dan mengurangi halusinasi. Untuk informasi lebih lanjut, lihat Basis pengetahuan (RAG).
Teks yang diambil oleh RAG juga menempati jendela konteks model bahasa besar. Oleh karena itu, Anda perlu menyesuaikan strategi pengambilan dan panjang teks sesuai kebutuhan agar jendela konteks dimanfaatkan secara optimal dan tidak melebihi batasnya.
Plug-in
Dengan memanggil plug-in, aplikasi agen dapat menjalankan tugas tertentu, seperti eksekusi kode, pencarian web, dan generasi teks-ke-citra. Model Studio menyediakan berbagai plug-in resmi dan mendukung penambahan plug-in kustom. Untuk informasi lebih lanjut, lihat Ikhtisar plug-in.

Interaksi agen
Percakapan teks
Percakapan teks adalah metode interaksi inti aplikasi agen, memberikan pengalaman percakapan multi-putaran yang cerdas dan personal.
Percakapan teks mendukung dua metode input utama:
Input teks: Masukkan teks untuk berdialog dengan agen.
Unggah file: Unggah file sebagai lampiran untuk agen. Berbagai format, seperti dokumen, citra, video, dan audio, didukung.

Publikasikan dan panggil agen
Agen Model Studio mendukung panggilan eksternal melalui API. Agen juga mendukung publikasi satu-klik ke platform pihak ketiga dan integrasi ke proses bisnis lain melalui komponen.
Publikasikan aplikasi
Publikasi aplikasi merupakan prasyarat untuk semua panggilan dan integrasi aplikasi agen selanjutnya.
Klik tombol Publish di pojok kanan atas halaman manajemen aplikasi agen, lalu klik Confirm Publish untuk menyelesaikan publikasi aplikasi.
Jika aplikasi bukan pertama kali dipublikasikan, jendela pop-up akan menampilkan perubahan sejak publikasi terakhir.
Jika aplikasi dibuat oleh akun RAM, pastikan Anda memiliki izin peran terkait layanan ram:CreateServiceLinkedRole sebelum mempublikasikan. Untuk informasi lebih lanjut, lihat Peran Terkait Layanan.
Panggil melalui API
Pada tab Publish Channels aplikasi agen, klik View API di sebelah kanan API Call untuk melihat metode memanggil aplikasi agen melalui API.
Ganti YOUR_API_KEY dengan Kunci API Model Studio Anda untuk memanggil API.

Manajemen agen
Hapus dan salin
Anda dapat menemukan kartu aplikasi yang telah dipublikasikan di Application Management. Di menu , Anda dapat menghapus atau menyalin agen, atau mengubah nama aplikasi.

Manajemen versi
Melalui fitur manajemen versi, Anda dapat mengedit deskripsi versi historis atau memilih dan menggunakan versi historis yang sebelumnya telah dipublikasikan.
Pada tab Application Configuration aplikasi agen, klik Version Management di pojok kanan atas bilah navigasi atas.

Pada daftar versi historis, pilih versi target:

Untuk mengubah informasi versi, arahkan kursor mouse ke ikon
lalu klik. Pada kotak dialog Edit Version Description, lakukan perubahan sesuai kebutuhan, lalu klik OK.Untuk menggunakan versi historis ini, klik Overwrite Current Draft, lalu klik Confirm pada kotak dialog konfirmasi.
Konten versi historis ini akan menimpa konten draf saat ini.
Penagihan
Penagihan untuk fitur agen terutama mencakup aspek-aspek berikut:
Panggilan model
Agen dikenai biaya panggilan model. Biaya spesifik tergantung pada jenis model dan jumlah token input serta output.
Untuk jenis model spesifik dan aturan penagihan yang sesuai, lihat Model.
Basis pengetahuan
Fitur basis pengetahuan gratis untuk waktu terbatas.
Segmen teks yang diambil dari basis pengetahuan meningkatkan jumlah token input model, yang dapat menyebabkan peningkatan biaya inferensi (panggilan) model. Untuk informasi lebih lanjut, lihat Penagihan basis pengetahuan.
Model yang didukung
Pembaruan data mungkin tertunda. Daftar model yang didukung mengacu pada yang ditampilkan dalam aplikasi agen.