全部產品
Search
文件中心

DataWorks:大模型服務管理

更新時間:Oct 22, 2025

DataWorks大模型服務為您提供高效部署、安全通訊與便捷調用的一站式能力,您可以基於DataWorks的Serverless資源群組輕鬆完成模型部署,並直接在資料開發工作單位中調用模型,所有流量均通過PrivateLink建立的私網通道傳輸,確保資料全程不出域,從而有效保障資料安全性。

支援的模型列表

類別

模型

說明

大語言模型

Qwen3-32B

Qwen3是Qwen系列的最新一代大型語言模型,提供一整套密集型和專家混合型(MoE)模型。基於廣泛的訓練,Qwen3在推理、指令遵循、代理能力及多語言支援方面實現突破性的進展。更多模型介紹資訊可參見Qwen3

重要
  • 0.6B1.7B4B8B模型部署需要最低配置24GB顯存。

  • 14B模型部署需要最低配置48GB顯存。

  • 32B模型部署需要最低配置96GB顯存。

Qwen3-14B

Qwen3-8B

Qwen3-4B

Qwen3-1.7B

Qwen3-0.6B

Qwen3-Embedding-8B

Qwen3-Embedding-4B

Qwen3-Embedding-0.6B

DeepSeek-R1-0528-Qwen3-8B

DeepSeek在訓練階段大規模使用強化學習技術,在僅有極少標註資料的情況下,極大提升模型推理能力。更多模型介紹資訊可參見DeepSeek

DeepSeek-R1-Distill-Qwen-1.5B

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-14B

向量模型

BGE-M3

BGE-M3是一個通用向量模型,支援密集檢索、多向量檢索和稀疏檢索,可處理從短文本到最長8192 tokens的輸入,並支援100多種自然語言。

BGE-Large-zh-v1.5

BGE Embedding是一個通用向量模型。 使用retromae對模型進行預訓練,再用對比學習在大規模成對資料上訓練模型。

大模型服務特性

快速部署:簡化上線流程

通過可視化介面引導,實現預訓練模型的低代碼部署。 您無需編寫基礎設施代碼,只需幾步簡單配置,即可完成模型服務的建立與發布,降低模型上線門檻。

安全內網通訊:保障服務隔離

DataWorks大模型服務將以全託管模式部署在DataWorks資源群組中,基於私網串連(PrivateLink)內網網域名稱解析(Private Hosted Zone)構建跨VPC內網通訊,實現網路隔離。使用者可通過 VPC 內網訪問該全託管模型,確保模型服務的安全性。

  • 網路隔離通訊:通過PrivateLink在使用者VPC與DataWorks資源群組VPC之間建立專用連線通道,確保流量不暴露於公網,實現安全隔離。

  • 私人網域名稱解析:通過Private Hosted Zone部署內網DNS解析服務,自動設定私人網域名稱轉寄規則,支援使用者在VPC內通過網域名稱直接存取模型服務。

自動化串連:實現無縫調用

當您在DataWorks資源群組中部署模型服務或為其配置專用網路時,系統將自動執行以下操作:

  1. 建立跨VPC串連。 在您的VPC(DataWorks資源群組可連通的使用者帳號下的VPC)中,系統會自動建立PrivateLink終端節點,並與DataWorks資源群組VPC的PrivateLink服務端建立加密通訊通道。

  2. 佈建網域名解析服務。 在模型服務配置的VPC中自動設定網域名稱解析規則,使得VPC內部網域名稱請求流量自動轉寄至DataWorks模型服務。

模型調用流程

當您通過網域名稱發起模型服務調用時:

  1. 請求解析:使用者VPC內的DNS請求由Private Hosted Zone解析,定位到DataWorks資源群組VPC的私人IP。

  2. 流量轉寄:請求通過PrivateLink建立的專用通道,從使用者VPC安全傳輸至DataWorks資源群組VPC。

  3. 服務響應:請求到達DataWorks資源群組VPC內的模型執行個體,完成推理計算並返回結果。

整個調用過程運行於內網環境,無需暴露公網IP,從而保障了模型服務的安全性與可控性。

模型部署與使用

在DataWorks中,通過選擇並部署相關模型來進行任務開發。

  1. 部署模型

  2. 使用大模型