Pilih dua konfigurasi utama untuk Model Studio:
Region: Menentukan lokasi akses layanan model dan tempat penyimpanan data statis Anda.
Deployment mode: Menentukan lokasi eksekusi inferensi.
Kedua konfigurasi ini bersifat independen, tetapi Anda harus menggunakannya dalam kombinasi yang telah ditentukan. Secara bersama, keduanya memengaruhi latensi, biaya, model yang tersedia, dan batas laju default. Terlepas dari mode penyebaran yang Anda pilih, data statis Anda (termasuk input dan output) selalu disimpan di wilayah yang dipilih.
Tip: Region mengontrol "di mana data Anda berada." Deployment mode mengontrol "di mana inferensi dijalankan." Gunakan keduanya untuk menyeimbangkan kebutuhan performa, biaya, dan kepatuhan.
Pemilihan wilayah
Wilayah untuk layanan model adalah lokasi fisik titik akhirnya. Saat memilih wilayah, pertimbangkan faktor-faktor berikut:
Latensi akses: Jarak fisik merupakan faktor utama yang memengaruhi waktu respons. Pilih wilayah yang secara geografis dekat dengan Anda dan pengguna akhir untuk meminimalkan latensi jaringan.
Persyaratan kepatuhan: Pilih wilayah yang memenuhi persyaratan kediaman data Anda. Penyebaran Anda harus mematuhi hukum dan peraturan setempat.
Ketersediaan fitur: Fitur dan model yang tersedia berbeda-beda di tiap wilayah. Untuk detailnya, lihat ketersediaan fitur berdasarkan wilayah dan daftar model yang tersedia.
Wilayah yang saat ini didukung: Singapura, AS (Virginia), Tiongkok (Beijing), Tiongkok (Hong Kong), Jerman (Frankfurt)
Seluruh data statis Anda disimpan di wilayah yang Anda pilih guna memenuhi persyaratan kediaman data.
Mode penyebaran
Mode penyebaran menentukan wilayah untuk inferensi model. Setiap mode Penyebaran terikat pada wilayah tertentu, dan Anda tidak dapat membuat kombinasi kustom.
Untuk mengurangi latensi jaringan dan meningkatkan kecepatan respons model, pilih mode Penyebaran yang sesuai dengan wilayah terdekat dari pengguna utama dan aplikasi bisnis Anda:
Deployment mode | Bound region (data storage) | Inference scope |
Global | AS (Virginia) atau Jerman (Frankfurt) | Penjadwalan dinamis global |
International | Singapura | Penjadwalan dinamis global (tidak termasuk Tiongkok daratan) |
United States | AS (Virginia) | Dibatasi hanya untuk Amerika Serikat |
Chinese Mainland | Tiongkok (Beijing) | Dibatasi hanya untuk Tiongkok daratan |
Hong Kong (China) | Hong Kong (Tiongkok) | Dibatasi hanya untuk Hong Kong (Tiongkok) |
European Union | Jerman (Frankfurt) | Dibatasi hanya untuk UE |
Mode Global: Ideal untuk beban kerja yang memerlukan ketersediaan tinggi bagi pengguna di seluruh dunia. Mode ini memanfaatkan sumber daya komputasi terdistribusi secara global untuk menjamin ketersediaan tinggi.
Mode International: Ideal untuk melayani pengguna di luar Tiongkok daratan (misalnya di Asia-Pasifik dan Amerika Serikat) ketika kebutuhan bisnis atau kepatuhan mewajibkan pengecualian sumber daya komputasi dari Tiongkok daratan.
Mode Chinese Mainland: Ideal untuk aplikasi yang terutama melayani pengguna di dalam Tiongkok daratan dan harus mematuhi peraturan lokal secara ketat.
Mode United States: Ideal untuk organisasi yang berbasis di Amerika Serikat, atau tunduk pada hukum AS, yang mewajibkan seluruh pemrosesan data dan inferensi model tetap berada secara eksklusif di dalam wilayah Amerika Serikat.
Mode Hong Kong (China): Ideal untuk melayani pengguna terutama di Hong Kong (Tiongkok) ketika penyimpanan data dan inferensi model harus dibatasi secara ketat di wilayah tersebut.
Mode EU: Ideal untuk melayani pengguna di Uni Eropa, atau untuk organisasi yang tunduk pada hukum UE, yang mewajibkan seluruh pemrosesan data dan inferensi model tetap berada secara eksklusif di dalam wilayah UE.
Pada mode penyebaran Global dan International, yang melibatkan komputasi lintas batas, Anda harus memastikan bahwa pemrosesan data lintas batas Anda mematuhi semua hukum dan peraturan yang berlaku. Titik akhir di wilayah yang Anda pilih menerima permintaan inferensi lintas-wilayah. Data statis yang dihasilkan selama panggilan model, seperti input prompt dan output model, hanya diproses secara sementara selama inferensi model dan tidak ditulis ke penyimpanan persisten di wilayah tempat sumber daya komputasi berada. Enkripsi melindungi seluruh data yang sedang ditransmisikan.
Penggunaan
Menggunakan model International dalam mode penyebaran
Konfigurasikan alamat permintaan, kunci API, dan nama model:
Alamat permintaan (Base URL): Untuk mode penyebaran International yang di-host di wilayah Singapura, gunakan nama domain
dashscope-intl.aliyuncs.com. Untuk API lainnya, lihat dokumentasi yang sesuai.API OpenAI Chat Completions:
https://<u>dashscope-intl.aliyuncs.com</u>/compatible-mode/v1DashScope:
https://<u>dashscope-intl.aliyuncs.com</u>/api/v1
API key: Buka halaman Key Management (Singapore) untuk mendapatkan kunci API Anda.
Nama model: Dari daftar Model, pilih model yang mendukung mode penyebaran ini.
Menggunakan model United States dalam mode penyebaran
Konfigurasikan alamat permintaan, kunci API, dan nama model:
Alamat permintaan (Base URL): Untuk mode penyebaran AS di wilayah AS (Virginia), gunakan nama domain
dashscope-us.aliyuncs.com. Untuk API lainnya, lihat dokumentasi yang sesuai.OpenAI Chat Completions API:
https://<u>dashscope-us.aliyuncs.com</u>/compatible-mode/v1DashScope:
https://<u>dashscope-us.aliyuncs.com</u>/api/v1
API key: Buka halaman Key Management (Virginia) untuk mendapatkan kunci API Anda.
Nama model: Dari daftar Model, pilih model untuk mode penyebaran AS (dengan akhiran
-us).
Menggunakan model Global dalam mode penyebaran
Mode penyebaran global mendukung beberapa wilayah. Pilih wilayah berdasarkan kebutuhan bisnis Anda.
Wilayah AS (Virginia)
Sebelum memulai, konfigurasikan alamat permintaan, kunci API, dan nama model:
Alamat permintaan (Base URL): Untuk wilayah AS (Virginia), gunakan nama domain
dashscope-us.aliyuncs.com. Untuk API lainnya, lihat dokumentasi yang relevan:API OpenAI Chat Completions:
https://<u>dashscope-us.aliyuncs.com</u>/compatible-mode/v1DashScope:
https://<u>dashscope-us.aliyuncs.com</u>/api/v1
API key: Buka halaman Key Management (Virginia) untuk mendapatkan kunci API Anda.
Nama model: Dari daftar Model, pilih model yang mendukung mode penyebaran Global.
Wilayah Jerman (Frankfurt)
Buka Konsol Model Studio, beralih ke wilayah Jerman (Frankfurt), klik ikon
di pojok kanan atas, lalu salin Workspace ID. Kemudian, konfigurasikan alamat permintaan, kunci API, dan nama model.
Alamat permintaan (Base URL): Untuk wilayah Jerman (Frankfurt), gunakan nama domain
{WorkspaceId}.eu-central-1.maas.aliyuncs.com. Saat melakukan panggilan API, ganti{WorkspaceId}dengan Workspace ID aktual Anda. Berikut adalah beberapa contoh alamat permintaan. Untuk API lainnya, lihat dokumentasi yang sesuai.API OpenAI Chat Completions:
https://<u>{WorkspaceId}</u>.eu-central-1.maas.<u>aliyuncs.com</u>/compatible-mode/v1DashScope:
https://{WorkspaceId}.eu-central-1.maas.<u>aliyuncs.com</u>/api/v1
API key: Buka halaman Key Management (Frankfurt) untuk mendapatkan kunci API Anda.
Nama model: Dari daftar Model, pilih model yang mendukung mode penyebaran Global.
Menggunakan model Chinese Mainland dalam mode penyebaran
Konfigurasikan alamat permintaan, kunci API, dan nama model:
Alamat permintaan (Base URL): Mode penyebaran Chinese mainland menggunakan wilayah Tiongkok (Beijing) dan nama domain layanan
dashscope.aliyuncs.com. Untuk API lainnya, lihat dokumentasi yang sesuai:OpenAI Chat Completions API:
https://<u>dashscope.aliyuncs.com</u>/compatible-mode/v1DashScope:
https://<u>dashscope.aliyuncs.com</u>/api/v1
API key: Buka halaman Key Management (Beijing) untuk mendapatkan kunci API Anda.
Nama model: Dari daftar Model, pilih model yang mendukung mode penyebaran ini.
Menggunakan model Hong Kong (China) dalam mode penyebaran
Konfigurasikan alamat permintaan, kunci API, dan nama model:
Alamat permintaan (Base URL): Untuk mode penyebaran Hong Kong (Tiongkok), gunakan nama domain
cn-hongkong.dashscope.aliyuncs.comdi wilayah Hong Kong. Berikut adalah beberapa contoh alamat permintaan. Untuk API lainnya, lihat dokumentasi yang sesuai.API OpenAI Chat Completions:
https://cn-hongkong.<u>dashscope.aliyuncs.com</u>/compatible-mode/v1DashScope:
https://cn-hongkong.<u>dashscope.aliyuncs.com</u>/api/v1
API key: Buka halaman Key Management (Hong Kong (China)) untuk mendapatkan kunci API Anda.
Nama model: Dari daftar Model, pilih model yang mendukung mode penyebaran Hong Kong (Tiongkok).
Menggunakan model European Union dalam mode penyebaran
Buka Konsol Alibaba Cloud, beralih ke wilayah Jerman (Frankfurt), klik ikon
di pojok kanan atas, lalu salin Workspace ID. Kemudian, konfigurasikan alamat permintaan, kunci API, dan nama model.
Alamat permintaan (Base URL): Mode penyebaran UE terikat pada wilayah Jerman (Frankfurt). Gunakan domain
{WorkspaceId}.eu-central-1.maas.aliyuncs.com. Saat melakukan panggilan, ganti{WorkspaceId}dengan Workspace ID aktual Anda. Berikut adalah beberapa contoh alamat permintaan. Untuk API lainnya, lihat dokumentasi yang sesuai:OpenAI Chat Completions API:
https://{WorkspaceId}.eu-central-1.maas.aliyuncs.com/compatible-mode/v1DashScope:
https://{WorkspaceId}.eu-central-1.maas.aliyuncs.com/api/v1
API key: Buka halaman Key Management (Frankfurt) untuk mendapatkan kunci API Anda.
Nama model: Dari daftar Model, pilih model yang mendukung mode penyebaran UE.
Tugas asinkron
Untuk tugas asinkron, seperti pembuatan gambar atau video, seluruh operasi berikutnya harus menggunakan nama domain layanan dan kunci API yang sama dengan yang digunakan saat membuat tugas tersebut. Jika tidak, permintaan akan gagal.
Contoh untuk mode penyebaran Global (wilayah AS). Untuk wilayah Jerman, gunakan {WorkspaceId}.eu-central-1.maas.aliyuncs.com:
# Buat tugas dalam mode penyebaran Global (wilayah AS) dengan nama domain layanan dashscope-us.aliyuncs.com
curl --location 'https://dashscope-us.aliyuncs.com/api/v1/services/aigc/image-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'X-DashScope-Async: enable' \
--data '{
"model": "wan2.6-t2i",
"input": {
"messages": [
{
"role": "user",
"content": [
{
"text": "A flower shop with exquisite windows, a beautiful wooden door, and flowers on display"
}
]
}
]
},
"parameters": {
"n": 1
}
}'
# Contoh respons: {"output":{"task_id":"abc123..."},"request_id":"..."}
# Periksa status tugas. Anda harus menggunakan nama domain layanan yang sama.
curl -X GET https://dashscope-us.aliyuncs.com/api/v1/tasks/{task_id} \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
# [Error] Menggunakan nama domain layanan yang berbeda untuk permintaan ini akan menyebabkan error.
curl -X GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id} \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"Ketersediaan fitur berdasarkan wilayah
Ketersediaan fitur berbeda-beda di tiap wilayah:
Kategori | Fitur | Singapura | AS (Virginia) | Tiongkok (Beijing) | Hong Kong (Tiongkok) | Jerman (Frankfurt) |
Penggunaan | Real-time inference | |||||
Batch inference | ||||||
Playground | ||||||
Manajemen | Monitoring (Standard) | |||||
Monitoring (Advanced) | ||||||
Model alerting | ||||||
Transmission security | ||||||
Permission management | ||||||
Optimasi | Fine-tuning |
Referensi
Daftar model: Model dan spesifikasi yang didukung.
Harga pemanggilan model: Harga berdasarkan mode penyebaran.
Batas laju: Batas RPM dan TPM.
Mendapatkan kunci API: Membuat dan mengelola kunci API.