Model Gallery merupakan komponen model-sebagai-layanan (MaaS) dari Platform for AI (PAI). Model Gallery menampilkan model-model state-of-the-art (SOTA) di berbagai bidang, termasuk large language model (LLM), konten yang dihasilkan oleh AI (AIGC), computer vision (CV), dan pemrosesan bahasa alami (NLP). Antarmuka low-code/no-code memfasilitasi seluruh siklus hidup model. Panduan ini menjelaskan cara menggunakan Model Gallery untuk menerapkan, menyuling, melatih, dan membangun aplikasi dengan model DeepSeek.
Sebelum Anda mulai
(Diperlukan) Aktifkan PAI dan buat ruang kerja
Ruang kerja PAI dirancang untuk manajemen terpusat sumber daya komputasi, izin, dan aset AI. Saat mengaktifkan PAI, ruang kerja default akan dibuat secara otomatis. Namun, jika belum memiliki ruang kerja, Anda perlu membuatnya secara manual. Layanan seperti Object Storage Service (OSS) diaktifkan secara default karena penyimpanan cloud diperlukan untuk menyimpan kode, model, dataset, dan file lainnya.
(Catatan) Wilayah dan spesifikasi sumber daya
Sebagian besar layanan Alibaba Cloud, seperti ruang kerja PAI dan bucket OSS, bersifat spesifik wilayah. Beberapa wilayah mungkin tidak saling terhubung, sehingga penting untuk memperhatikan wilayah yang dipilih.
Ketersediaan dan spesifikasi sumber daya komputasi dapat bervariasi signifikan antar wilayah. Jika wilayah tertentu kekurangan sumber daya, pertimbangkan untuk memeriksa wilayah lain.

PAI menawarkan dua opsi penagihan: bayar sesuai penggunaan dan langganan. Sumber daya bayar sesuai penggunaan dibagi oleh semua pengguna, sehingga Anda mungkin mengalami kehabisan stok. Dalam kasus seperti itu, pertimbangkan untuk memeriksa wilayah lain.
PAI menyediakan berbagai spesifikasi sumber daya untuk skenario yang berbeda. Beberapa spesifikasi dibatasi untuk pengguna dalam daftar putih. Untuk saran yang disesuaikan dengan skenario Anda, konsultasikan dengan manajer penjualan Anda.
Platform ini juga mendukung Sumber daya Lingjun, yang menggunakan jaringan berkecepatan tinggi untuk komunikasi dan penting untuk pelatihan terdistribusi atau penyebaran. Sumber daya Lingjun juga dibatasi untuk pengguna dalam daftar putih. Hubungi manajer penjualan Anda jika diperlukan.

(Opsional) Buat VPC untuk pelatihan terdistribusi atau penyebaran
Penyebaran model
Penyebaran Satu Klik DeepSeek-V3 dan DeepSeek-R1.
Kami merekomendasikan DeepSeek-R1-Distill-Qwen-7B, sebuah model yang telah disuling dengan ukuran lebih kecil, menjadikannya ideal untuk latihan cepat. Model ini memiliki persyaratan sumber daya komputasi yang rendah dan dapat diterapkan menggunakan sumber daya uji coba gratis.
Fine-tuning dan distilasi
Fine-tuning: Gunakan data pribadi Anda untuk melatih model, sehingga responsnya menjadi lebih akurat dalam skenario Anda.
Distilasi: Transfer pengetahuan dari model guru yang lebih besar ke model siswa yang lebih kecil. Ini mempertahankan kemampuan inferensi dan akurasi model guru sambil secara signifikan mengurangi biaya komputasi dan penyimpanan. Distilasi juga merupakan bentuk fine-tuning.
Fine-tuning bukan tugas sederhana dan tidak dapat menyelesaikan semua masalah. Keberhasilannya bergantung pada berbagai faktor, seperti ukuran dan kualitas dataset, hyper-parameter pelatihan, serta banyak percobaan. Dalam banyak skenario praktis, fine-tuning mungkin bukan solusi terbaik, ketika aplikasi retrieval-augmented generation (RAG) yang lebih sederhana sudah cukup. Semua tergantung pada kebutuhan spesifik Anda.
Bangun aplikasi AI
Kembangkan aplikasi dengan LangStudio
PAI menyediakan modul LangStudio, yang menyederhanakan pengembangan aplikasi LLM tingkat perusahaan. LangStudio memiliki template bawaan untuk jenis aplikasi AI paling populer, seperti RAG dan pencarian web. Anda dapat membuat aplikasi AI yang sesuai dengan konfigurasi sederhana.
DeepSeek + Basis Pengetahuan: Gunakan LangStudio untuk Membuat Alur Aplikasi Q&A Berbasis DeepSeek dan RAG untuk Keuangan dan Perawatan Kesehatan
DeepSeek + Pencarian Web: Gunakan LangStudio dan Alibaba Cloud IQS untuk Membuat Alur Aplikasi Berbasis DeepSeek dan Pencarian Web
DeepSeek + Basis Pengetahuan + Pencarian Web: Gunakan LangStudio dan DeepSeek untuk Menerapkan Chatbot Berbasis RAG dan Pencarian Web




