Layanan model besar DataWorks menyediakan solusi terpadu untuk penerapan yang efisien, komunikasi aman, dan pemanggilan layanan yang mudah. Anda dapat menerapkan model menggunakan kelompok sumber daya arsitektur tanpa server DataWorks dan memanggilnya langsung dalam tugas pengembangan data. Seluruh lalu lintas ditransmisikan melalui saluran pribadi yang dibangun dengan PrivateLink, sehingga data tetap berada dalam domain pribadi dan keamanannya terjamin.
Model yang didukung
Kategori | Model | Deskripsi |
Model bahasa besar | Qwen3-32B | Qwen3 adalah generasi terbaru model bahasa besar dalam seri Qwen. Model ini menawarkan rangkaian lengkap model dense dan Mixture-of-Experts (MoE). Pelatihan ekstensif memberikan kemampuan terobosan pada Qwen3 dalam hal penalaran, mengikuti instruksi, fungsi agen, serta dukungan multibahasa. Untuk informasi lebih lanjut tentang model ini, lihat Qwen3. Penting
|
Qwen3-14B | ||
Qwen3-8B | ||
Qwen3-4B | ||
Qwen3-1.7B | ||
Qwen3-0.6B | ||
Qwen3-Embedding-8B | ||
Qwen3-Embedding-4B | ||
Qwen3-Embedding-0.6B | ||
DeepSeek-R1-0528-Qwen3-8B | DeepSeek secara ekstensif menggunakan Pembelajaran Penguatan selama fase pelatihannya. Hal ini secara signifikan meningkatkan kemampuan Inferensi model, bahkan dengan data yang sangat sedikit yang telah dianotasi. Untuk informasi lebih lanjut tentang model ini, lihat DeepSeek. | |
DeepSeek-R1-Distill-Qwen-1,5B | ||
DeepSeek-R1-Distill-Qwen-7B | ||
DeepSeek-R1-Distill-Qwen-14B | ||
Model vektor | BGE-M3 | BGE-M3 adalah model vektor tujuan umum. Model ini mendukung Pengambilan dense, Pengambilan multi-vektor, dan Pengambilan sparse. Model ini memproses input mulai dari teks pendek hingga maksimal 8.192 token dan mendukung lebih dari 100 bahasa alami. |
BGE-Large-zh-v1.5 | BGE Embedding adalah model vektor tujuan umum. Model ini dipra-latih menggunakan retromae, lalu dilatih pada data berpasangan berskala besar menggunakan pembelajaran kontras. |
Fitur layanan model besar
Penerapan cepat: Proses daring yang disederhanakan
Antarmuka visual terpandu memungkinkan penerapan model pra-latih dengan kode minimal tanpa perlu menulis kode infrastruktur. Cukup dengan beberapa konfigurasi sederhana, Anda dapat membuat dan menerbitkan layanan model, sehingga mengurangi hambatan dalam membawa model ke lingkungan daring.
Komunikasi internal aman: Isolasi layanan terjamin
Layanan model besar DataWorks diterapkan dalam mode sepenuhnya terkelola di dalam kelompok sumber daya DataWorks. Layanan ini memanfaatkan PrivateLink dan zona pribadi untuk membangun komunikasi internal lintas-VPC dan memastikan isolasi jaringan. Anda dapat mengakses model yang sepenuhnya dikelola dari jaringan internal VPC Anda, sehingga keamanan layanan model terjamin.
Komunikasi terisolasi jaringan: PrivateLink membangun saluran koneksi khusus antara VPC Anda dan VPC kelompok sumber daya DataWorks, memastikan lalu lintas tidak terekspos ke internet dan memberikan isolasi keamanan.
Resolusi nama domain pribadi: Zona pribadi menyediakan layanan resolusi DNS internal dan secara otomatis mengonfigurasi aturan pengalihan untuk Nama domain pribadi, memungkinkan Anda mengakses layanan model langsung dari dalam VPC menggunakan Nama domain.
Koneksi otomatis: Pemanggilan layanan yang mulus
Saat Anda menerapkan layanan model dalam kelompok sumber daya DataWorks atau mengonfigurasi VPC untuknya, sistem secara otomatis melakukan langkah-langkah berikut:
Membangun koneksi lintas-VPC: Di VPC Anda (VPC di bawah akun Anda yang dapat terhubung ke kelompok sumber daya DataWorks), sistem secara otomatis membuat titik akhir PrivateLink dan membangun saluran komunikasi terenkripsi dengan layanan PrivateLink di VPC kelompok sumber daya DataWorks.
Mengonfigurasi layanan resolusi Nama domain: Aturan resolusi Nama domain dikonfigurasi secara otomatis di VPC tempat layanan model dikonfigurasi, sehingga permintaan Nama domain dari dalam VPC secara otomatis diteruskan ke layanan model DataWorks.
Alur pemanggilan model
Saat Anda memanggil layanan model menggunakan Nama domain:
Penguraian permintaan: Permintaan DNS di dalam VPC Anda diselesaikan oleh zona pribadi ke Alamat IP pribadi VPC kelompok sumber daya DataWorks.
Pengalihan trafik: Permintaan ditransmisikan secara aman dari VPC Anda ke VPC kelompok sumber daya DataWorks melalui saluran khusus yang dibangun oleh PrivateLink.
Tanggapan layanan: Permintaan mencapai instans model di dalam VPC kelompok sumber daya DataWorks. Instans tersebut menyelesaikan Inferensi dan mengembalikan hasilnya.
Seluruh proses berlangsung di lingkungan jaringan pribadi tanpa eksposur Alamat IP publik, sehingga menjamin keamanan dan kontrol penuh atas layanan model.
Penerapan dan penggunaan model
Di DataWorks, Anda dapat mengembangkan tugas dengan memilih dan menerapkan model yang diperlukan.