API Model dirancang untuk tim yang mengembangkan aplikasi artificial intelligence (AI), menyediakan konfigurasi dan debugging gerbang AI yang fleksibel dan cerdas. Anda dapat menyetel berbagai plugin sebelumnya, seperti proxy AI, observabilitas AI, otorisasi konsumen, dan Moderasi Konten. Topik ini menjelaskan cara membuat, mengedit, mendebug, dan menghapus API Model.
Buat API Model
Pada panel navigasi di sebelah kiri, klik LLM API, lalu klik Create LLM API.
Pilih skenario dan klik tombol Create yang sesuai.
Skenario yang Anda pilih menentukan opsi Protokol yang tersedia dan rute default yang secara otomatis dibuat oleh sistem. Skenario berikut didukung:
Text Generation (Teks): Mendukung protokol kompatibel OpenAI dan Anthropic.
Image Generation
Video Generation (Video)
Speech Synthesis (Audio)
Embedding
Text Ranking (Rerank)
Others
Konfigurasikan informasi dasar.
Pada jendela pop-up, pertama-tama lengkapi bagian Select Scenario. Pada formulir Create Model API yang muncul, konfigurasikan pengaturan sebagai berikut:
Protocol: Setiap protokol menyediakan serangkaian rute default bawaan untuk skenario yang dipilih. Hal ini membantu Anda dengan cepat menghasilkan API yang kompatibel untuk layanan umum seperti OpenAI, DashScope, dan vLLM.
API Name: Nama kustom untuk API. Nama harus unik secara global dalam akun Anda dan dapat terdiri dari maksimal 64 karakter. Nama dapat berisi huruf, angka, garis bawah (_), dan tanda hubung (-).
Domain Name: Nama domain yang digunakan untuk mengakses API. Anda dapat memilih lebih dari satu. Kombinasi nama domain dan
BasePathharus unik.Jika Anda tidak memiliki nama domain, klik tombol Add Domain Name di sebelah kanan untuk membuat satu.
Base Path: Jalur permintaan dasar API. Nilai default adalah
/. Anda juga dapat mengaktifkan Remove Base Path When Forwarding To Backend Service.CatatanJika Anda mengaktifkan Remove When Forwarding To The Backend Service, sistem secara otomatis menghapus base path dari URI permintaan sebelum meneruskan permintaan ke layanan backend. Contohnya:
Base path diatur ke /api.
Jalur permintaan asli adalah /api/users.
Jalur yang diteruskan ke layanan backend adalah /users.
AI Request Observability: Jika Anda mengaktifkan fitur ini, Anda dapat melihat metrik, pencatatan log, dan informasi pelacakan. Pencatatan log dan pelacakan bergantung pada layanan Pengiriman log SLS. Anda dapat memilih Record Request Content dan Record Response Content untuk mencatat permintaan yang dikirim ke model besar atau konteks yang dikembalikan oleh model besar.
PentingJika Anda mengaktifkan fitur ini, sistem mencatat seluruh konten permintaan AI, termasuk badan permintaan, ke log akses. Pastikan Anda telah mengonfigurasi SLS dengan benar dan menerapkan langkah-langkah perlindungan keamanan data.
Large Model Service: Mendukung Single-Model Service, Multi-Model Service (by Model Name), dan Multi-Model Service (by Weight).
Single-model Service: Pilih satu layanan AI dan atur Model Name. Nama model dapat diteruskan atau ditulis ulang.
Multi-model Service (by Model Name): Mengarahkan permintaan ke layanan berbeda dengan mencocokkan nama model dalam badan permintaan dengan suatu aturan. Aturan ini mendukung karakter wildcard
?dan*. Misalnya,qwen-*dapat mencocokkanqwen-maxdanqwen-long.Multi-model Service (by Weight): Pilih beberapa layanan AI dan atur bobotnya. Layanan ini mendukung penerusan atau penulisan ulang nama model.
Fallback: Anda dapat Enable fitur ini dan mengonfigurasi beberapa kebijakan fallback secara berurutan. Anda dapat menggunakan kembali layanan yang sama.
Timeout paket pertama: Waktu maksimum, dalam milidetik, untuk menunggu paket tanggapan pertama dalam tanggapan streaming. Pengaturan ini cocok untuk skenario interaksi streaming yang sensitif terhadap latensi tanggapan. Nilai 0 menonaktifkan fitur ini.
Resource Group: Anda dapat memilih kelompok sumber daya default, kelompok sumber daya yang sudah ada, atau membuat yang baru. Kelompok sumber daya digunakan untuk mengelompokkan, memberi otorisasi, dan memantau sumber daya dalam akun Anda.
Untuk membuat kelompok sumber daya baru, klik Create Resource Group.
Konfirmasi parameter dan klik OK untuk membuat API Model.
Rincian rute default
Bagian ini menjelaskan rute default yang secara otomatis dibuat oleh sistem saat Anda memilih Protokol berbeda untuk Skenario berbeda.
Generasi teks (Teks)
Protokol: Kompatibel OpenAI (OpenAI/v1)
Nama Rute | Jalur | Metode | Deskripsi |
|
| POST | Membuat tanggapan model untuk percakapan chat yang diberikan. |
|
| POST | Membuat kelengkapan untuk prompt dan parameter yang diberikan. |
Protokol: Anthropic (Anthropic)
Protokol Anthropic dirancang untuk rangkaian model Anthropic, seperti Claude. Protokol ini menyediakan format pesan dan metode interaksi native. Protokol ini cocok untuk skenario aplikasi yang memerlukan format API Anthropic native.
Penyedia model besar yang mendukung protokol ini meliputi Alibaba Cloud Model Studio (Qwen), Claude, Moonshot AI (Moonshot), dan Zhipu AI. Layanan AI dari penyedia ini secara otomatis mendukung protokol Anthropic tanpa memerlukan konfigurasi tambahan.
Nama Rute | Path | Metode | Deskripsi |
|
| POST | Membuat pesan untuk percakapan chat yang diberikan menggunakan format pesan native Anthropic. |
Generasi citra (Citra)
Protokol: Generasi citra Alibaba Cloud Model Studio
Nama Rute | Jalur | Metode | Deskripsi |
|
| POST | Hasilkan citra sintesis teks-ke-gambar. |
|
| POST | Hasilkan citra sintesis gambar-ke-gambar. |
|
| POST | Hasilkan citra outpainting gambar-ke-gambar. |
|
| POST | Hasilkan citra model virtual. |
|
| POST | Hasilkan citra generasi latar belakang. |
|
| GET/POST/PUT/PATCH/DELETE | Kelola tugas asinkron. |
Protokol: Kompatibel OpenAI
Nama Rute | Jalur | Metode | Deskripsi |
|
| POST | Hasilkan citra. |
|
| POST | Edit citra. |
|
| POST | Membuat variasi dari citra yang diberikan. |
Protokol: ComfyUI
Nama Rute | Jalur | Metode | Deskripsi |
|
| GET | Titik akhir WebSocket untuk komunikasi real-time dengan server. |
|
| GET | Ambil daftar penyematan yang tersedia. |
|
| GET | Ambil daftar ekstensi yang mendaftarkan direktori web. |
|
| GET | Ambil fitur dan kemampuan server. |
|
| GET | Ambil daftar jenis model yang tersedia. |
|
| GET | Ambil model dalam folder tertentu. |
|
| GET | Ambil peta modul node kustom dan alur kerja templat terkait. |
|
| POST | Unggah citra. |
|
| POST | Unggah masker. |
|
| GET | Lihat citra. Banyak opsi tersedia. |
|
| GET | Ambil metadata untuk model. |
|
| GET | Ambil informasi sistem, seperti versi Python, perangkat, dan VRAM. |
|
| GET/POST | Ambil status antrian saat ini dan informasi eksekusi atau kirimkan prompt ke antrian. |
|
| GET | Ambil detail semua jenis node. |
|
| GET | Ambil detail satu jenis node. |
|
| GET/POST | Ambil riwayat antrian. |
|
| GET | Ambil riwayat antrian untuk prompt tertentu. |
|
| GET/POST | Ambil status saat ini dari antrian eksekusi atau kelola operasi antrian. |
|
| POST | Hentikan eksekusi alur kerja saat ini. |
|
| POST | Bebaskan memori dengan melepas model tertentu. |
|
| GET | Daftar file data pengguna dalam direktori tertentu. |
|
| GET | Daftar file dan direktori dalam format terstruktur. |
|
| GET/POST/DELETE | Ambil, unggah, perbarui, atau hapus file data pengguna tertentu. |
|
| POST | Pindahkan atau ubah nama file data pengguna. |
|
| GET/POST | Dapatkan informasi pengguna atau buat pengguna baru. |
Generasi video (Video)
Protokol: Generasi video Alibaba Cloud Model Studio
Nama Rute | Path | Metode | Deskripsi |
|
| POST | Hasilkan video sintesis generasi video. |
|
| POST | Hasilkan video sintesis gambar-ke-video. |
|
| GET/POST/PUT/PATCH/DELETE | Kelola tugas asinkron. |
Sintesis suara (Audio)
Protokol: Sintesis suara Alibaba Cloud Model Studio
Nama Rute | Jalur | Metode | Deskripsi |
|
| GET | Hasilkan audio sintesis teks-ke-suara. |
Protokol: Kompatibel OpenAI (OpenAI/v1)
Nama Rute | Jalur | Metode | Deskripsi |
|
| POST | Hasilkan audio ucapan. |
Vektorisasi (Penyematan)
Protokol: Kompatibel OpenAI (OpenAI/v1)
Nama Rute | Jalur | Metode | Deskripsi |
|
| POST | Membuat vektor penyematan yang merepresentasikan teks input. |
Penyusunan ulang teks (Rerank)
Protokol: Penyusunan ulang teks Alibaba Cloud Model Studio
Nama Rute | Jalur | Metode | Deskripsi |
|
| POST | Menyusun ulang dokumen yang diberikan berdasarkan relevansi kueri. |
Protokol: vLLM (vLLM)
Nama Rute | Jalur | Metode | Deskripsi |
|
| POST | Menyusun ulang dokumen yang diberikan berdasarkan relevansi kueri. |
Lainnya
Protokol: Kompatibel OpenAI (OpenAI/v1)
Nama Rute | Path | Metode | Deskripsi |
|
| GET/POST/PUT/PATCH/DELETE | Kelola model. |
|
| GET/POST/PUT/PATCH/DELETE | Kelola file. |
|
| GET/POST/PUT/PATCH/DELETE | Kelola batch. |
|
| GET/POST/PUT/PATCH/DELETE | Kelola pekerjaan fine-tuning. |
Kompatibilitas: Saat Anda membuat layanan AI untuk penyedia model besar yang mendukung protokol Anthropic, seperti Alibaba Cloud Model Studio, Claude, Moonshot AI, dan Zhipu AI, beberapa protokol didukung secara otomatis. Protokol tersebut mencakup protokol kompatibel OpenAI dan protokol Anthropic. Anda kemudian dapat memilih protokol yang sesuai saat membuat API Model.
Edit Model API
Pada panel navigasi di sebelah kiri, klik Model API, lalu klik Edit pada kolom Aksi API target. Pada panel Edit Model API, ubah parameter. Untuk informasi lebih lanjut tentang parameter, lihat Buat API Model.
Konfirmasi perubahan Anda dan klik OK.
Debug API Model
Saat ini, Anda hanya dapat mendebug generasi teks menggunakan titik akhir /v1/chat/completions.
Pada panel navigasi di sebelah kiri, pilih Model API, lalu klik Debug pada kolom Aksi API target.
Pada panel Debug, pilih nama domain dan model, aktifkan sakelar Streaming Request jika diperlukan, dan konfigurasikan parameter serta parameter kustom. Pada tab Model Response, masukkan konten Anda dan klik Send untuk memulai debugging.

Hapus API Model
Pada panel navigasi di sebelah kiri, pilih Model API, klik Delete pada kolom Aksi API target. Pada kotak dialog konfirmasi yang muncul, masukkan nama API dan klik Delete.