大模型服務 - DataWorks

DataWorks大模型服務為您提供高效部署、安全通訊與便捷調用的一站式能力，您可以基於DataWorks的Serverless資源群組輕鬆完成模型部署，並直接在資料開發工作單位中調用模型，所有流量均通過PrivateLink建立的私網通道傳輸，確保資料全程不出域，從而有效保障資料安全性。

支援的模型列表

類別	模型	說明
大語言模型	Qwen3-32B	Qwen3是Qwen系列的最新一代大型語言模型，提供一整套密集型和專家混合型（MoE）模型。基於廣泛的訓練，Qwen3在推理、指令遵循、代理能力及多語言支援方面實現突破性的進展。更多模型介紹資訊可參見Qwen3。重要 `0.6B`、`1.7B`、`4B`、`8B`模型部署需要最低配置`24GB`顯存。 `14B`模型部署需要最低配置`48GB`顯存。 `32B`模型部署需要最低配置`96GB`顯存。
	Qwen3-14B
	Qwen3-8B
	Qwen3-4B
	Qwen3-1.7B
	Qwen3-0.6B
	Qwen3-Embedding-8B
	Qwen3-Embedding-4B
	Qwen3-Embedding-0.6B
	DeepSeek-R1-0528-Qwen3-8B	DeepSeek在訓練階段大規模使用強化學習技術，在僅有極少標註資料的情況下，極大提升模型推理能力。更多模型介紹資訊可參見DeepSeek。
	DeepSeek-R1-Distill-Qwen-1.5B
	DeepSeek-R1-Distill-Qwen-7B
	DeepSeek-R1-Distill-Qwen-14B
向量模型	BGE-M3	BGE-M3是一個通用向量模型，支援密集檢索、多向量檢索和稀疏檢索，可處理從短文本到最長8192 tokens的輸入，並支援100多種自然語言。
向量模型	BGE-Large-zh-v1.5	BGE Embedding是一個通用向量模型。使用retromae對模型進行預訓練，再用對比學習在大規模成對資料上訓練模型。

通過可視化介面引導，實現預訓練模型的低代碼部署。您無需編寫基礎設施代碼，只需幾步簡單配置，即可完成模型服務的建立與發布，降低模型上線門檻。

DataWorks大模型服務將以全託管模式部署在DataWorks資源群組中，基於私網串連（PrivateLink）與內網網域名稱解析（Private Hosted Zone）構建跨VPC內網通訊，實現網路隔離。使用者可通過 VPC 內網訪問該全託管模型，確保模型服務的安全性。

網路隔離通訊：通過PrivateLink在使用者VPC與DataWorks資源群組VPC之間建立專用連線通道，確保流量不暴露於公網，實現安全隔離。
私人網域名稱解析：通過Private Hosted Zone部署內網DNS解析服務，自動設定私人網域名稱轉寄規則，支援使用者在VPC內通過網域名稱直接存取模型服務。

當您在DataWorks資源群組中部署模型服務或為其配置專用網路時，系統將自動執行以下操作：

建立跨VPC串連。在您的VPC（DataWorks資源群組可連通的使用者帳號下的VPC）中，系統會自動建立PrivateLink終端節點，並與DataWorks資源群組VPC的PrivateLink服務端建立加密通訊通道。
佈建網域名解析服務。在模型服務配置的VPC中自動設定網域名稱解析規則，使得VPC內部網域名稱請求流量自動轉寄至DataWorks模型服務。

當您通過網域名稱發起模型服務調用時：

整個調用過程運行於內網環境，無需暴露公網IP，從而保障了模型服務的安全性與可控性。

在DataWorks中，通過選擇並部署相關模型來進行任務開發。