DataWorks大模型服務為您提供高效部署、安全通訊與便捷調用的一站式能力,您可以基於DataWorks的Serverless資源群組輕鬆完成模型部署,並直接在資料開發工作單位中調用模型,所有流量均通過PrivateLink建立的私網通道傳輸,確保資料全程不出域,從而有效保障資料安全性。
支援的模型列表
類別 | 模型 | 說明 |
大語言模型 | Qwen3-32B | Qwen3是Qwen系列的最新一代大型語言模型,提供一整套密集型和專家混合型(MoE)模型。基於廣泛的訓練,Qwen3在推理、指令遵循、代理能力及多語言支援方面實現突破性的進展。更多模型介紹資訊可參見Qwen3。 重要
|
Qwen3-14B | ||
Qwen3-8B | ||
Qwen3-4B | ||
Qwen3-1.7B | ||
Qwen3-0.6B | ||
Qwen3-Embedding-8B | ||
Qwen3-Embedding-4B | ||
Qwen3-Embedding-0.6B | ||
DeepSeek-R1-0528-Qwen3-8B | DeepSeek在訓練階段大規模使用強化學習技術,在僅有極少標註資料的情況下,極大提升模型推理能力。更多模型介紹資訊可參見DeepSeek。 | |
DeepSeek-R1-Distill-Qwen-1.5B | ||
DeepSeek-R1-Distill-Qwen-7B | ||
DeepSeek-R1-Distill-Qwen-14B | ||
向量模型 | BGE-M3 | BGE-M3是一個通用向量模型,支援密集檢索、多向量檢索和稀疏檢索,可處理從短文本到最長8192 tokens的輸入,並支援100多種自然語言。 |
BGE-Large-zh-v1.5 | BGE Embedding是一個通用向量模型。 使用retromae對模型進行預訓練,再用對比學習在大規模成對資料上訓練模型。 |
大模型服務特性
快速部署:簡化上線流程
通過可視化介面引導,實現預訓練模型的低代碼部署。 您無需編寫基礎設施代碼,只需幾步簡單配置,即可完成模型服務的建立與發布,降低模型上線門檻。
安全內網通訊:保障服務隔離
DataWorks大模型服務將以全託管模式部署在DataWorks資源群組中,基於私網串連(PrivateLink)與內網網域名稱解析(Private Hosted Zone)構建跨VPC內網通訊,實現網路隔離。使用者可通過 VPC 內網訪問該全託管模型,確保模型服務的安全性。
網路隔離通訊:通過PrivateLink在使用者VPC與DataWorks資源群組VPC之間建立專用連線通道,確保流量不暴露於公網,實現安全隔離。
私人網域名稱解析:通過Private Hosted Zone部署內網DNS解析服務,自動設定私人網域名稱轉寄規則,支援使用者在VPC內通過網域名稱直接存取模型服務。
自動化串連:實現無縫調用
當您在DataWorks資源群組中部署模型服務或為其配置專用網路時,系統將自動執行以下操作:
建立跨VPC串連。 在您的VPC(DataWorks資源群組可連通的使用者帳號下的VPC)中,系統會自動建立PrivateLink終端節點,並與DataWorks資源群組VPC的PrivateLink服務端建立加密通訊通道。
佈建網域名解析服務。 在模型服務配置的VPC中自動設定網域名稱解析規則,使得VPC內部網域名稱請求流量自動轉寄至DataWorks模型服務。
模型調用流程
當您通過網域名稱發起模型服務調用時:
請求解析:使用者VPC內的DNS請求由Private Hosted Zone解析,定位到DataWorks資源群組VPC的私人IP。
流量轉寄:請求通過PrivateLink建立的專用通道,從使用者VPC安全傳輸至DataWorks資源群組VPC。
服務響應:請求到達DataWorks資源群組VPC內的模型執行個體,完成推理計算並返回結果。
整個調用過程運行於內網環境,無需暴露公網IP,從而保障了模型服務的安全性與可控性。
模型部署與使用
在DataWorks中,通過選擇並部署相關模型來進行任務開發。