人工智慧平台 PAI 為開發人員提供從資料標註、模型開發到訓練部署的全鏈路AI研發服務。其 Model Gallery (MaaS組件)整合多領域當前最佳模型(覆蓋LLM、AIGC、CV、NLP等),通過低代碼/零代碼介面支援模型訓練、壓縮、評測、部署全流程,顯著提升開發效率。本文為您介紹如何通過Model Gallery實現DeepSeek模型的雲上部署、蒸餾、訓練以及應用搭建。
準備工作
【必需】開通 PAI 並建立工作空間(注意地區選擇)
工作空間是 PAI 平台的核心概念,旨在為企業和團隊提供統一的計算資源管理、人員許可權管理、AI資產管理等能力。目前在首次開通PAI時會建立一個預設工作空間,如果您還沒有任何工作空間,請手動建立一個工作空間。同時還會預設開通Object Storage Service等必要功能,因為在AI開發中,我們需要藉助雲端儲存體服務來訪問、管理與儲存我們的代碼、模型、資料集等資料檔案。
【注意】地區與資源規格
在剛剛開通PAI工作空間,以及建立OSS Bucket時,我們可以發現大部分阿里雲的產品是有地區屬性的。不同地區之間可能存在不互連的情況,因此在使用產品時需要我們注意地區的選擇。
不同地區所提供的計算資源的規格、庫存都可能大不相同,因此如果在某一地區發現缺少計算資源的情況,我們可以嘗試切換地區來查看其他地區的資產庫存。

PAI 平台支援隨用隨付(後付費)和訂用帳戶(預付費)兩種計費模式。在使用後付費資源時,由於所有使用者共用同一個資源集區,可能會出現資源沒有庫存的現象,這時可以嘗試切換地區來尋找閒置計算資源。
PAI 平台提供多樣化的計算資源規格,適配不同使用情境。部分資源規格使用了白名單限制,可以根據您的使用情境諮詢您的銷售顧問。此外,PAI平台也支援靈駿智算資源,靈駿智算資源使用了高速網路進行通訊,在一些情境中進行多機多卡分布式訓練、多機多卡分布式部署時,只有使用通過高速網路連接的靈駿智算資源才能進行;靈駿智算資源也使用了白名單限制,如需使用請聯絡您的銷售顧問。

【可選】建立 VPC 專用網路(分布式訓練/部署需要)
模型部署
您可以參考一鍵部署DeepSeek-V3、DeepSeek-R1模型進行DeepSeek相關模型的部署和調用。
建議您使用DeepSeek-R1-Distill-Qwen-7B(蒸餾版模型,尺寸較小,適合快速上手實踐,且所需計算資源成本低,還可以使用免費試用資源)體驗部署流程。
模型微調與蒸餾
微調訓練:用私域資料來微調訓練模型,讓模型在私域資料上的回答更加精確。
模型蒸餾:將大模型的知識遷移到小模型中(用教師大模型產生訓練資料來訓練學生模型)。保留大模型的推理能力和準確性,同時大幅降低計算和儲存成本。本質上也是微調訓練的一種形式。
模型微調訓練並不是萬能的,想要取得好的微調效果並不是簡單的事情。模型微調訓練受到資料集數量、資料集品質、微調訓練參數等多方面的影響,往往一次成功的微調訓練需要經歷大量的實驗對比。此外,在很多實際需求的情境中,模型微調訓練並不一定是最優的解決方案,很有可能更加簡單的知識庫檢索(RAG)應用便能滿足您的需求。因此,我們還是需要從具體需求出發,再來判斷使用何種方式去對已有的模型服務進行最佳化。
請根據您的具體需求,選擇微調訓練或者蒸餾訓練。
僅微調模型,請參見一鍵微調DeepSeek-R1蒸餾模型。
搭建AI應用
使用LangStudio開發應用
在 PAI 平台,我們提供了大模型應用開發(LangStudio)產品模組,簡化了使用者開發企業級大模型應用的過程。目前最熱門的 AI 應用類型,例如 RAG知識庫檢索、連網搜尋等,都已在 LangStudio 內建了模板,只需要簡單的配置便可以建立相應的 AI 應用。
DeepSeek + 知識庫:基於LangStudio搭建DeepSeek+RAG在金融和醫學領域的問答應用流
DeepSeek + 連網搜尋:基於LangStudio&阿里雲資訊查詢服務搭建DeepSeek連網搜尋應用流
DeepSeek + 知識庫 + 連網搜尋:基於LangStudio&DeepSeek的RAG及連網搜尋聊天機器人解決方案




