全部产品
Search
文档中心

DataWorks:Penyebaran model

更新时间:Oct 17, 2025

Sebarkan model LLM yang telah dilatih sebelumnya pada infrastruktur tanpa server. Tidak diperlukan pengelolaan kluster.

Penagihan

Penyebaran model mengakibatkan biaya dari DataWorks dan Layanan Alibaba Cloud terkait:

Layanan

Biaya

Biaya DataWorks

Ditagih per Jam-CU saat model sedang berjalan. Untuk informasi lebih lanjut, lihat Penagihan kelompok sumber daya tanpa server.

Biaya Non-DataWorks

Cara kerjanya

DataWorks menjalankan model Anda sebagai layanan yang sepenuhnya dikelola di dalam kelompok sumber daya tanpa server. Untuk akses internal yang aman, sistem secara otomatis mengonfigurasi PrivateLink dan Private Hosted Zone selama penyebaran:

  • PrivateLink: Membuat saluran data terenkripsi antara VPC Anda dan kelompok sumber daya DataWorks, memungkinkan komunikasi lintas-VPC pribadi.

  • Private Hosted Zone: Menyediakan resolusi DNS sehingga Anda dapat mengakses model Anda menggunakan nama domain kustom dari dalam VPC Anda.

Pemanggilan API menggunakan nama domain model melewati saluran data PrivateLink dari VPC Anda ke instans model yang berjalan di kelompok sumber daya DataWorks. Anda dapat memantau sumber daya ini di Konsol PrivateLink dan Konsol DNS Alibaba Cloud.

Catatan penggunaan

Penting

Semua layanan harus berada di wilayah yang sama dengan ruang kerja Anda.

Batasan

  • Wilayah: Cina (Hangzhou), Cina (Shanghai), Cina (Beijing), Cina (Ulanqab), Cina (Shenzhen), Cina (Hong Kong), Jepang (Tokyo), Singapura, Malaysia (Kuala Lumpur), Indonesia (Jakarta), Jerman (Frankfurt), AS (Silicon Valley), dan AS (Virginia).

  • Penyebaran: Hanya model (pelatihan tidak didukung).

  • Kuota: 50 layanan per Akun Alibaba Cloud per wilayah, 5 layanan per kelompok sumber daya.

  • Jaringan: Maksimum 3 VPC per layanan.

Menyebar model

Akses halaman penyebaran

  1. Masuk ke Konsol DataWorks dan beralih ke wilayah target Anda.

  2. Klik Model Service di panel navigasi kiri.

  3. Klik Deployment Model, pilih model, lalu klik Deployment.

Konfigurasikan penyebaran

  • Model: Model yang akan disebar. Untuk informasi lebih lanjut, lihat Kelola layanan model.

  • Nama Layanan: Pengenal unik untuk penyebaran ini.

Pengaturan sumber daya

Pengaturan

Deskripsi

Resource Group

Kelompok sumber daya tanpa server Anda. Lihat penggunaan di konsol di bawah Resource Group > Resource Group Name > Details.

Switch

Saklar vSwitch yang terhubung ke kelompok sumber daya Anda.

Deployment Specifications

Pilih spesifikasi sumber daya.

Number of instances

Instans ganda meningkatkan ketersediaan.

Total occupancy

Dihitung secara otomatis: Deployment Specifications × Number of instances.

Pastikan kelompok sumber daya Anda memiliki cukup CU tersedia untuk layanan model. Untuk informasi lebih lanjut, lihat Alokasikan kuota CU.
  • Kelompok langganan: Perluas kapasitas sesuai kebutuhan.

  • Kelompok bayar sesuai pemakaian: 500 CU default, diperluas otomatis menjadi 2000 CU setelah penyebaran pertama.

Klik Deploy.

Penting

DataWorks secara otomatis membuat PrivateLink, Private Hosted Zone, dan grup keamanan. Jangan hapus atau ubah ini—mereka dihapus secara otomatis saat Anda menghapus layanan.

Setelah penyebaran selesai:

  • Titik akhir PrivateLink muncul di VPC default Anda, terhubung ke kelompok sumber daya DataWorks.

  • Rekaman DNS ditambahkan ke Private Hosted Zone, memetakan domain layanan ke titik akhir PrivateLink di VPC Anda.

Kelola model

Setelah layanan model dibuat, Anda dapat mengelola status model, melihat informasi layanan, mengelola jaringan dan kunci API, serta menyesuaikan sumber daya sesuai kebutuhan dari daftar Model Service.

Kelola status model

Layanan model mulai secara default setelah pembuatan. Anda dapat mengelola statusnya di kolom Actions.

Operasi

Perubahan status layanan model

Konsumsi sumber daya

Mulai

Sedang beroperasi

Mengonsumsi sumber daya kelompok sumber daya tanpa server.

Hentikan

Dihentikan

Tidak mengonsumsi sumber daya kelompok sumber daya tanpa server.

Hapus

Melepaskan sepenuhnya sumber daya kelompok sumber daya tanpa server.

Lihat layanan model

Tab Overview menampilkan informasi konfigurasi untuk layanan model saat ini.

  1. Di daftar Model Service, temukan layanan model target dan klik namanya untuk masuk ke tab Overview.

  2. Anda dapat mengelola Basic Information, Resource Allocation, dan Invocation Information layanan model.

    • Basic Information: Seperti nama layanan, ID layanan, dan tipe.

    • Resource Allocation: Termasuk detail seperti Deployment Specifications dan Number of instances.

    • Invocation Information: Untuk memanggil layanan dan gunakan model dalam tugas node, klik ikon image di sebelah VPC Address Invocation Domain Name untuk menyalin dan mendapatkan parameter nama domain.

Ubah sumber daya model

Untuk layanan model yang telah dibuat, Anda dapat mengubah nama layanan, menyesuaikan spesifikasi penyebaran, dan mengubah jumlah instans untuk penyebaran layanan model.

  1. Di daftar Model Service, klik nama layanan model target untuk masuk ke tab Overview.

  2. Klik Modification di sebelah Resource Allocation dan konfigurasikan pengaturannya.

    Penting

    Mengubah sumber daya menyebabkan layanan dimulai ulang, yang memengaruhi operasi layanan model.

Kelola jaringan model

Tab Network Configuration menampilkan VPC yang saat ini dapat mengakses layanan model melalui jaringan internal. Di tab tersebut, Anda dapat menambahkan atau mengelola VPC yang dapat digunakan untuk mengakses layanan model.

  1. Di daftar Model Service, klik nama layanan model target untuk masuk ke tab Overview.

  2. Beralih ke tab Network Configuration untuk melihat VPC.

  3. Untuk memperluas jangkauan akses, Anda dapat mengklik Add Network untuk mengizinkan lebih banyak VPC mengakses layanan model yang diterapkan di DataWorks.

    Saat menambahkan jaringan, Anda harus menentukan VPC dan vSwitch. Anda dapat mengakses layanan model melalui VPC setelah statusnya berubah menjadi Tersedia.
    Catatan
    • Penagihan: Setelah menambahkan VPC untuk layanan model, sistem membuat titik akhir PrivateLink di VPC yang Anda pilih untuk mengakses layanan model, menetapkan konektivitas jaringan dengan kelompok sumber daya DataWorks. Rekaman DNS juga ditambahkan ke Private Hosted Zone. Proses ini mengakibatkan biaya instans, pemrosesan lalu lintas, dan biaya resolusi nama domain. Untuk informasi lebih lanjut, lihat Penagihan PrivateLink dan Penagihan Private Hosted Zone.

    • Batasan: Anda dapat menambahkan maksimal tiga VPC untuk setiap layanan model.

  4. Jika Anda tidak ingin lagi mengizinkan VPC tertentu mengakses layanan model, Anda dapat mengklik Delete untuk VPC target di layanan model.

    Saat Anda menghapus VPC dari layanan model, titik akhir PrivateLink yang dibuat di VPC tersebut juga dihapus.

Kelola kunci API

Kunci API adalah kredensial otentikasi yang disediakan oleh layanan model untuk mengotentikasi identitas dan izin pemanggil. Anda dapat mengelola semua kunci API untuk memanggil layanan model saat ini di tab API Key.

  1. Di daftar Model Service, klik nama layanan model target untuk masuk ke tab Overview.

  2. Beralih ke tab API Key untuk membuat, mengelola, dan menggunakan kunci API.

    • Tambah Kunci API: Setelah layanan model berhasil disebar, DataWorks secara otomatis menghasilkan kunci internal untuk integrasi platform. Jika Anda perlu memanggil model melalui Titik akhir layanan model di lingkungan lain, klik Add New API Key untuk membuat kunci API baru.

      Disarankan untuk membuat kunci API terpisah untuk kasus penggunaan yang berbeda.
    • Lihat Kunci API: Klik View di kolom Actions dari Kunci API target, lalu klik Copy untuk mendapatkan Kunci API.

    • Hapus kunci API: Kunci API DataWorks menyediakan fungsi Disable dan Delete.

      Penting

      Jika Anda perlu menonaktifkan atau menghapus Kunci API yang aktif, evaluasi dampaknya terlebih dahulu. Setelah Kunci API dinonaktifkan atau dihapus, semua tugas yang menggunakan Kunci API untuk memanggil model akan gagal.

      Disable atau Delete operasi memerlukan waktu sekitar 5 menit untuk berlaku.

Operasi lainnya

Setelah menyebar model, Anda dapat gunakan model untuk mengembangkan tugas terkait.

Cara pemanggilan bekerja

Deskripsi berikut menjelaskan cara kerja pemanggilan layanan model:

Saat Anda menyebar layanan model di kelompok sumber daya DataWorks atau mengonfigurasi VPC untuknya, sistem secara otomatis melakukan operasi berikut:

  1. Membuat koneksi lintas-VPC. Di VPC Anda (VPC di akun Anda yang dapat berkomunikasi dengan kelompok sumber daya DataWorks), sistem secara otomatis membuat titik akhir PrivateLink dan menetapkan saluran komunikasi terenkripsi dengan layanan titik akhir PrivateLink di VPC kelompok sumber daya DataWorks.

    Operasi ini secara otomatis membuat titik akhir PrivateLink di akun Anda. Akun Anda harus memiliki layanan PrivateLink yang diaktifkan.
  2. Konfigurasikan layanan resolusi nama domain. Sistem secara otomatis mengonfigurasi aturan resolusi nama domain di VPC, sehingga lalu lintas permintaan nama domain di dalam VPC secara otomatis diteruskan ke layanan model DataWorks.

    Operasi ini secara otomatis menyebarkan layanan Private Hosted Zone di akun Anda. Akun Anda harus memiliki layanan ini diaktifkan.