全部产品
Search
文档中心

API Gateway:Mengelola API Model

更新时间:Nov 10, 2025

API Model dirancang untuk tim yang mengembangkan aplikasi artificial intelligence (AI), menyediakan konfigurasi dan debugging gerbang AI yang fleksibel dan cerdas. Anda dapat menyetel berbagai plugin sebelumnya, seperti proxy AI, observabilitas AI, otorisasi konsumen, dan Moderasi Konten. Topik ini menjelaskan cara membuat, mengedit, mendebug, dan menghapus API Model.

Buat API Model

  1. Pada panel navigasi di sebelah kiri, klik LLM API, lalu klik Create LLM API.

  2. Pilih skenario dan klik tombol Create yang sesuai.

    Skenario yang Anda pilih menentukan opsi Protokol yang tersedia dan rute default yang secara otomatis dibuat oleh sistem. Skenario berikut didukung:

    • Text Generation (Teks): Mendukung protokol kompatibel OpenAI dan Anthropic.

    • Image Generation

    • Video Generation (Video)

    • Speech Synthesis (Audio)

    • Embedding

    • Text Ranking (Rerank)

    • Others

  3. Konfigurasikan informasi dasar.

    Pada jendela pop-up, pertama-tama lengkapi bagian Select Scenario. Pada formulir Create Model API yang muncul, konfigurasikan pengaturan sebagai berikut:

    • Protocol: Setiap protokol menyediakan serangkaian rute default bawaan untuk skenario yang dipilih. Hal ini membantu Anda dengan cepat menghasilkan API yang kompatibel untuk layanan umum seperti OpenAI, DashScope, dan vLLM.

    • API Name: Nama kustom untuk API. Nama harus unik secara global dalam akun Anda dan dapat terdiri dari maksimal 64 karakter. Nama dapat berisi huruf, angka, garis bawah (_), dan tanda hubung (-).

    • Domain Name: Nama domain yang digunakan untuk mengakses API. Anda dapat memilih lebih dari satu. Kombinasi nama domain dan BasePath harus unik.

      Jika Anda tidak memiliki nama domain, klik tombol Add Domain Name di sebelah kanan untuk membuat satu.
    • Base Path: Jalur permintaan dasar API. Nilai default adalah /. Anda juga dapat mengaktifkan Remove Base Path When Forwarding To Backend Service.

      Catatan

      Jika Anda mengaktifkan Remove When Forwarding To The Backend Service, sistem secara otomatis menghapus base path dari URI permintaan sebelum meneruskan permintaan ke layanan backend. Contohnya:

      • Base path diatur ke /api.

      • Jalur permintaan asli adalah /api/users.

      • Jalur yang diteruskan ke layanan backend adalah /users.

    • AI Request Observability: Jika Anda mengaktifkan fitur ini, Anda dapat melihat metrik, pencatatan log, dan informasi pelacakan. Pencatatan log dan pelacakan bergantung pada layanan Pengiriman log SLS. Anda dapat memilih Record Request Content dan Record Response Content untuk mencatat permintaan yang dikirim ke model besar atau konteks yang dikembalikan oleh model besar.

      Penting

      Jika Anda mengaktifkan fitur ini, sistem mencatat seluruh konten permintaan AI, termasuk badan permintaan, ke log akses. Pastikan Anda telah mengonfigurasi SLS dengan benar dan menerapkan langkah-langkah perlindungan keamanan data.

    • Large Model Service: Mendukung Single-Model Service, Multi-Model Service (by Model Name), dan Multi-Model Service (by Weight).

      • Single-model Service: Pilih satu layanan AI dan atur Model Name. Nama model dapat diteruskan atau ditulis ulang.

      • Multi-model Service (by Model Name): Mengarahkan permintaan ke layanan berbeda dengan mencocokkan nama model dalam badan permintaan dengan suatu aturan. Aturan ini mendukung karakter wildcard ? dan *. Misalnya, qwen-* dapat mencocokkan qwen-max dan qwen-long.

      • Multi-model Service (by Weight): Pilih beberapa layanan AI dan atur bobotnya. Layanan ini mendukung penerusan atau penulisan ulang nama model.

    • Fallback: Anda dapat Enable fitur ini dan mengonfigurasi beberapa kebijakan fallback secara berurutan. Anda dapat menggunakan kembali layanan yang sama.

    • Timeout paket pertama: Waktu maksimum, dalam milidetik, untuk menunggu paket tanggapan pertama dalam tanggapan streaming. Pengaturan ini cocok untuk skenario interaksi streaming yang sensitif terhadap latensi tanggapan. Nilai 0 menonaktifkan fitur ini.

    • Resource Group: Anda dapat memilih kelompok sumber daya default, kelompok sumber daya yang sudah ada, atau membuat yang baru. Kelompok sumber daya digunakan untuk mengelompokkan, memberi otorisasi, dan memantau sumber daya dalam akun Anda.

      Untuk membuat kelompok sumber daya baru, klik Create Resource Group.
  4. Konfirmasi parameter dan klik OK untuk membuat API Model.

Rincian rute default

Bagian ini menjelaskan rute default yang secara otomatis dibuat oleh sistem saat Anda memilih Protokol berbeda untuk Skenario berbeda.

Generasi teks (Teks)

Protokol: Kompatibel OpenAI (OpenAI/v1)

Nama Rute

Jalur

Metode

Deskripsi

create-chat-completion

/v1/chat/completions

POST

Membuat tanggapan model untuk percakapan chat yang diberikan.

create-completion

/v1/completions

POST

Membuat kelengkapan untuk prompt dan parameter yang diberikan.

Protokol: Anthropic (Anthropic)

Protokol Anthropic dirancang untuk rangkaian model Anthropic, seperti Claude. Protokol ini menyediakan format pesan dan metode interaksi native. Protokol ini cocok untuk skenario aplikasi yang memerlukan format API Anthropic native.

Catatan

Penyedia model besar yang mendukung protokol ini meliputi Alibaba Cloud Model Studio (Qwen), Claude, Moonshot AI (Moonshot), dan Zhipu AI. Layanan AI dari penyedia ini secara otomatis mendukung protokol Anthropic tanpa memerlukan konfigurasi tambahan.

Nama Rute

Path

Metode

Deskripsi

create-message

/v1/messages

POST

Membuat pesan untuk percakapan chat yang diberikan menggunakan format pesan native Anthropic.

Generasi citra (Citra)

Protokol: Generasi citra Alibaba Cloud Model Studio

Nama Rute

Jalur

Metode

Deskripsi

dashscope-text-to-image-synthesis

/api/v1/services/aigc/text2image/image-synthesis

POST

Hasilkan citra sintesis teks-ke-gambar.

dashscope-image-to-image-synthesis

/api/v1/services/aigc/image2image/image-synthesis

POST

Hasilkan citra sintesis gambar-ke-gambar.

dashscope-image-to-image-outpainting

/api/v1/services/aigc/image2image/out-painting

POST

Hasilkan citra outpainting gambar-ke-gambar.

dashscope-virtual-model-generation

/api/v1/services/aigc/virtualmodel/generation

POST

Hasilkan citra model virtual.

dashscope-background-generation

/api/v1/services/aigc/background-generation/generation

POST

Hasilkan citra generasi latar belakang.

tasks

/api/v1/tasks

GET/POST/PUT/PATCH/DELETE

Kelola tugas asinkron.

Protokol: Kompatibel OpenAI

Nama Rute

Jalur

Metode

Deskripsi

openai-image-generation

/api/v1/images/generations

POST

Hasilkan citra.

openai-image-edit

/api/v1/images/edits

POST

Edit citra.

openai-image-variation

/api/v1/images/variations

POST

Membuat variasi dari citra yang diberikan.

Protokol: ComfyUI

Nama Rute

Jalur

Metode

Deskripsi

comfyui-websocket

/ws

GET

Titik akhir WebSocket untuk komunikasi real-time dengan server.

comfyui-embeddings

/embeddings

GET

Ambil daftar penyematan yang tersedia.

comfyui-extensions

/extensions

GET

Ambil daftar ekstensi yang mendaftarkan direktori web.

comfyui-features

/features

GET

Ambil fitur dan kemampuan server.

comfyui-models

/models

GET

Ambil daftar jenis model yang tersedia.

comfyui-models-folder

/models/{folder}

GET

Ambil model dalam folder tertentu.

comfyui-workflow-templates

/workflow_templates

GET

Ambil peta modul node kustom dan alur kerja templat terkait.

comfyui-upload-image

/upload/image

POST

Unggah citra.

comfyui-upload-mask

/upload/mask

POST

Unggah masker.

comfyui-view

/view

GET

Lihat citra. Banyak opsi tersedia.

comfyui-view-metadata

/view_metadata/

GET

Ambil metadata untuk model.

comfyui-system-stats

/system_stats

GET

Ambil informasi sistem, seperti versi Python, perangkat, dan VRAM.

comfyui-prompt

/prompt

GET/POST

Ambil status antrian saat ini dan informasi eksekusi atau kirimkan prompt ke antrian.

comfyui-object-info

/object_info

GET

Ambil detail semua jenis node.

comfyui-object-info-class

/object_info/{node_class}

GET

Ambil detail satu jenis node.

comfyui-history

/history

GET/POST

Ambil riwayat antrian.

comfyui-history-prompt-id

/history/{prompt_id}

GET

Ambil riwayat antrian untuk prompt tertentu.

comfyui-queue

/queue

GET/POST

Ambil status saat ini dari antrian eksekusi atau kelola operasi antrian.

comfyui-interrupt

/interrupt

POST

Hentikan eksekusi alur kerja saat ini.

comfyui-free

/free

POST

Bebaskan memori dengan melepas model tertentu.

comfyui-userdata

/userdata

GET

Daftar file data pengguna dalam direktori tertentu.

comfyui-userdata-v2

/v2/userdata

GET

Daftar file dan direktori dalam format terstruktur.

comfyui-userdata-file

/userdata/{file}

GET/POST/DELETE

Ambil, unggah, perbarui, atau hapus file data pengguna tertentu.

comfyui-userdata-file-move

/userdata/{file}/move/{dest}

POST

Pindahkan atau ubah nama file data pengguna.

comfyui-users

/users

GET/POST

Dapatkan informasi pengguna atau buat pengguna baru.

Generasi video (Video)

Protokol: Generasi video Alibaba Cloud Model Studio

Nama Rute

Path

Metode

Deskripsi

dashscope-video-generation-synthesis

/api/v1/services/aigc/video-generation/video-synthesis

POST

Hasilkan video sintesis generasi video.

dashscope-image-to-video-synthesis

/api/v1/services/aigc/image2video/video-synthesis

POST

Hasilkan video sintesis gambar-ke-video.

tasks

/api/v1/tasks

GET/POST/PUT/PATCH/DELETE

Kelola tugas asinkron.

Sintesis suara (Audio)

Protokol: Sintesis suara Alibaba Cloud Model Studio

Nama Rute

Jalur

Metode

Deskripsi

dashscope-text-to-audio-synthesis

/api-ws/v1/inference

GET

Hasilkan audio sintesis teks-ke-suara.

Protokol: Kompatibel OpenAI (OpenAI/v1)

Nama Rute

Jalur

Metode

Deskripsi

openai-audio-speech

/api/v1/audio/speech

POST

Hasilkan audio ucapan.

Vektorisasi (Penyematan)

Protokol: Kompatibel OpenAI (OpenAI/v1)

Nama Rute

Jalur

Metode

Deskripsi

create-embedding

/v1/embeddings

POST

Membuat vektor penyematan yang merepresentasikan teks input.

Penyusunan ulang teks (Rerank)

Protokol: Penyusunan ulang teks Alibaba Cloud Model Studio

Nama Rute

Jalur

Metode

Deskripsi

rerank

/api/v1/services/rerank/text-rerank/text-rerank

POST

Menyusun ulang dokumen yang diberikan berdasarkan relevansi kueri.

Protokol: vLLM (vLLM)

Nama Rute

Jalur

Metode

Deskripsi

rerank

/v1/rerank

POST

Menyusun ulang dokumen yang diberikan berdasarkan relevansi kueri.

Lainnya

Protokol: Kompatibel OpenAI (OpenAI/v1)

Nama Rute

Path

Metode

Deskripsi

models

/v1/models

GET/POST/PUT/PATCH/DELETE

Kelola model.

files

/v1/files

GET/POST/PUT/PATCH/DELETE

Kelola file.

batches

/v1/batches

GET/POST/PUT/PATCH/DELETE

Kelola batch.

fine-tuning

/v1/fine_tuning

GET/POST/PUT/PATCH/DELETE

Kelola pekerjaan fine-tuning.

Catatan

Kompatibilitas: Saat Anda membuat layanan AI untuk penyedia model besar yang mendukung protokol Anthropic, seperti Alibaba Cloud Model Studio, Claude, Moonshot AI, dan Zhipu AI, beberapa protokol didukung secara otomatis. Protokol tersebut mencakup protokol kompatibel OpenAI dan protokol Anthropic. Anda kemudian dapat memilih protokol yang sesuai saat membuat API Model.

Edit Model API

  1. Pada panel navigasi di sebelah kiri, klik Model API, lalu klik Edit pada kolom Aksi API target. Pada panel Edit Model API, ubah parameter. Untuk informasi lebih lanjut tentang parameter, lihat Buat API Model.

  2. Konfirmasi perubahan Anda dan klik OK.

Debug API Model

Catatan

Saat ini, Anda hanya dapat mendebug generasi teks menggunakan titik akhir /v1/chat/completions.

  1. Pada panel navigasi di sebelah kiri, pilih Model API, lalu klik Debug pada kolom Aksi API target.

  2. Pada panel Debug, pilih nama domain dan model, aktifkan sakelar Streaming Request jika diperlukan, dan konfigurasikan parameter serta parameter kustom. Pada tab Model Response, masukkan konten Anda dan klik Send untuk memulai debugging.

    image

Hapus API Model

  1. Pada panel navigasi di sebelah kiri, pilih Model API, klik Delete pada kolom Aksi API target. Pada kotak dialog konfirmasi yang muncul, masukkan nama API dan klik Delete.