Alibaba Cloud Model Studio mengintegrasikan seri Qwen dan LLM pihak ketiga utama dengan API resmi Qwen maupun API yang kompatibel dengan OpenAI. Layanan modelnya mencakup berbagai modalitas, termasuk teks, gambar, audio, dan video, serta mendukung berbagai skenario seperti generasi kode, terjemahan, penambangan data, dan pengenalan niat. Anda dapat menggunakan kemampuan model sesuai kebutuhan tanpa perlu mengelola infrastruktur dasar, sehingga mengurangi beban teknis O&M.
Anda dapat berinteraksi dengan LLM untuk menjalankan tugas seperti pembuatan konten dan ringkasan hanya dengan beberapa baris kode. Model Studio kompatibel dengan standar API OpenAI. Untuk memigrasikan kode OpenAI yang sudah ada ke Model Studio, Anda hanya perlu menyesuaikan kunci API, URL dasar, dan nama model. |
Layanan model
Model Studio menyediakan layanan model siap pakai. Anda dapat langsung memanggil model eksklusif Qwen dan model pihak ketiga, seperti DeepSeek dan Kimi, tanpa perlu menerapkan atau memeliharanya. Lihat Daftar model.
Model unggulan Qwen:
Qwen-Max: Model dengan performa terbaik dalam seri Qwen, cocok untuk menangani tugas kompleks bersifat multi-langkah.
Qwen-Plus: Pilihan seimbang antara performa, kecepatan, dan biaya, cocok untuk skenario umum.
Qwen-Flash: Hemat biaya dan latensi rendah, cocok untuk tugas sederhana yang memerlukan respons cepat.
Qwen-Coder: Unggul dalam pemanggilan alat dan interaksi lingkungan, serta dikhususkan untuk generasi dan pemahaman kode.
Cakupan multimodal: Meliputi berbagai kemampuan, seperti generasi teks, pemahaman visual, generasi gambar, generasi video, pengenalan suara dan sintesis, serta penyematan.
Model khusus domain: Menyediakan berbagai model domain untuk industri dan tugas tertentu, seperti pemrosesan dokumen panjang, terjemahan, penambangan data, pengenalan niat, bermain peran, dan riset mendalam.
Penagihan
Aktivasi Model Studio tidak dikenai biaya. Anda akan dikenai biaya saat memanggil model. Lihat Item yang Dikenai Biaya dan Daftar model.
Kuota gratis untuk pengguna baru
Model Studio memberikan kuota gratis eksklusif kepada pengguna baru di wilayah Singapura untuk mencoba panggilan model. Setelah kuota habis, penagihan secara otomatis beralih ke metode bayar sesuai penggunaan. Untuk menghindari biaya tak terduga, Anda dapat mengaktifkan fitur Prevent overage charges. Layanan akan berhenti secara otomatis saat kuota habis. Lihat Kuota gratis untuk pengguna baru.
Cara pembayaran
Panggilan model dikenai biaya secara otomatis per jam. Untuk informasi tentang metode pembayaran yang didukung, lihat Pengenalan metode pembayaran.
Lihat tagihan dan penggunaan
Rincian penagihan: Anda dapat mengunjungi halaman Detailed Bills dan Cost Analysis.
Statistik panggilan: Sekitar satu jam setelah panggilan model selesai, kunjungi halaman Model Observation (Singapura), Model Observation (Virginia), atau Model Observation (Beijing), atur kondisi kueri, lalu klik Monitor di kolom Actions untuk model target. Anda kemudian dapat melihat statistik model seperti volume panggilan, konsumsi token, dan tingkat keberhasilan. Lihat Pemantauan Model.
Memulai dengan Model Studio
Coba model secara online: Playground (Singapura), Playground (Virginia), atau Playground (Beijing)
FAQ
T: Apakah data saya aman? Apakah Model Studio akan menggunakan data saya untuk pelatihan?
J: Tidak. Alibaba Cloud secara ketat melindungi privasi data dan tidak akan pernah menggunakan data Anda untuk pelatihan model. Data yang Anda transmisikan saat membuat aplikasi atau melatih model dienkripsi untuk menjamin keamanan data. Lihat Pemberitahuan privasi.
T: Apa perbedaan antara wilayah Singapura, AS (Virginia), dan China (Beijing)?
J: Alibaba Cloud Model Studio menyediakan layanan model di wilayah Internasional (Singapura), AS (Virginia), dan China (Beijing). Memanggil model dari wilayah terdekat mengurangi latensi jaringan. Titik akhir layanan (Endpoint/URL dasar) dan kunci API bersifat spesifik per wilayah dan tidak dapat saling dipertukarkan. Model yang didukung, fitur platform, dan harga juga berbeda-beda tergantung wilayah. Lihat Daftar model.
T: Bagaimana cara menghindari pembayaran otomatis?
J: Model Studio menggunakan model bayar sesuai penggunaan dan tidak memiliki sakelar "pembayaran otomatis". Untuk menghindari biaya, Anda dapat mengambil langkah-langkah berikut:
Hapus kunci API Anda
Kunjungi halaman API-KEY (Singapura), API-KEY (Virginia), atau API-KEY (Beijing) dan hapus semua kunci API. Setelah dihapus, Anda tidak dapat lagi memanggil model Model Studio melalui API, sehingga mencegah biaya tambahan.
Hentikan semua aktivitas panggilan model
Hentikan panggilan model dalam aplikasi Anda.
Hentikan panggilan dari aplikasi seperti agen dan alur kerja.
Periksa dan hentikan tugas terjadwal atau proses latar belakang.
Biaya dipicu oleh panggilan aktual. Pastikan semua aktivitas panggilan telah dihentikan.
Aktifkan fitur Prevent overage charges (hanya untuk pengguna baru)
Di halaman produk model yang mendukung fitur ini, aktifkan sakelar tersebut. Saat kuota gratis habis, layanan akan berhenti secara otomatis dan mengembalikan kode kesalahan `AllocationQuota.FreeTierOnly` untuk mencegah biaya.
Catatan: Fitur ini hanya berlaku untuk model di wilayah Singapura dan hanya berlaku selama periode kuota gratis.
Atur pemantauan dan peringatan biaya
Lihat Detailed Bills.
Kunjungi Model Observation (Singapura), Model Observation (Virginia), atau Model Observation (Beijing) untuk melihat statistik panggilan, yang diperbarui sekitar satu jam setelah setiap panggilan.
Atur High-spending Alerts. Saat tagihan harian untuk produk tertentu melebihi ambang batas, sistem akan mengirimkan pengingat pesan teks harian agar Anda dapat segera mengambil tindakan.
Dengan mengambil langkah-langkah ini, Anda dapat mengendalikan biaya penggunaan secara efektif.
T: Bagaimana cara menggunakan model Qwen3 atau DeepSeek?
A:
Coba online: Kunjungi halaman Models (Singapura), Models (Virginia), atau Models (Beijing), lalu klik model untuk mencobanya. Perhatikan bahwa DeepSeek hanya didukung di wilayah China (Beijing).
Panggil model melalui API: Untuk prosedurnya, lihat Lakukan panggilan API pertama Anda ke Qwen. Untuk daftar model yang didukung, lihat Daftar model.
Panggil model melalui alat developer (seperti Claude Code): Lihat Klien dan alat developer.