通用文本向量模型可將文本資料轉換為數值向量,用於語義搜尋、推薦、聚類、分類等下遊任務。
模型概覽
新加坡
|
模型名稱 |
向量維度 |
最大行數 |
單行最大處理Token數(注) |
單價(每百萬輸入Token) |
支援語種 |
免費額度(注) |
|
text-embedding-v4 屬於Qwen3-Embedding系列 |
2,048、1,536、1,024(預設)、768、512、256、128、64 |
10 |
8,192 |
$0.07 |
中文、英語、西班牙語、法語、葡萄牙語、印尼語、日語、韓語、德語、俄羅斯語等100+主流語種 |
100萬Token 有效期間:百鍊開通後90天內 |
|
text-embedding-v3 |
1,024(預設)、768、512 |
中文、英語、西班牙語、法語、葡萄牙語、印尼語、日語、韓語、德語、俄羅斯語等50+主流語種 |
50萬Token 有效期間:百鍊開通後90天內 |
北京
|
模型名稱 |
向量維度 |
最大行數 |
單行最大Token數 |
單價(每百萬輸入Token) |
支援語種 |
|
text-embedding-v4 屬於Qwen3-Embedding系列 |
2,048、1,536、1,024(預設)、768、512、256、128、64 |
10 |
8,192 |
$0.072 |
中文、英語、西班牙語、法語、葡萄牙語、印尼語、日語、韓語、德語、俄羅斯語等100+主流語種及多種程式設計語言 |
中國香港
|
模型名稱 |
向量維度 |
最大行數 |
單行最大Token數 |
單價(每百萬輸入Token) |
支援語種 |
|
text-embedding-v4 屬於Qwen3-Embedding系列 |
2,048、1,536、1,024(預設)、768、512、256、128、64 |
10 |
8,192 |
$0.07 |
中文、英語、西班牙語、法語、葡萄牙語、印尼語、日語、韓語、德語、俄羅斯語等100+主流語種及多種程式設計語言 |
關於模型限流,請參考限流。
前提條件
若熟悉OpenAI生態,可使用相容API快速遷移;DashScope API則提供更豐富的專屬特性。請根據您的需求選擇。
您需要已擷取API Key並配置API Key到環境變數(準備下線,併入配置 API Key)。如果通過SDK調用,還需要安裝DashScope SDK。請將範例程式碼中的 DASHSCOPE_API_HOST 替換為擷取的 API Host。
OpenAI相容
使用SDK調用時需配置的base_url:
-
新加坡:https://dashscope-intl.aliyuncs.com/compatible-mode/v1
-
華北2(北京):https://dashscope.aliyuncs.com/compatible-mode/v1
-
中國香港:https://cn-hongkong.dashscope.aliyuncs.com/compatible-mode/v1
使用HTTP方式調用時需配置的endpoint:
-
新加坡:POST https://dashscope-intl.aliyuncs.com/compatible-mode/v1/embeddings
-
華北2(北京):POST https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings
-
中國香港:POST https://cn-hongkong.dashscope.aliyuncs.com/compatible-mode/v1/embeddings
請求體 |
輸入字串Python
Java
curl如果使用華北2(北京)地區的模型,請使用華北2(北京)地區的 API KEY,並將url替換為:https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings
輸入字串列表Python
Java
curl如果使用華北2(北京)地區的模型,請使用華北2(北京)地區的 API KEY,並將url替換為:https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings
輸入檔案Python
Java
curl如果使用華北2(北京)地區的模型,請使用華北2(北京)地區的 API KEY,並將url替換為:https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings 確保將 'texts_to_embedding.txt' 替換為您自己的檔案名稱或路徑
|
|
model 調用的模型名稱,參考模型概覽表格中的模型名稱進行選擇。 |
|
|
input 輸入待處理的文本。可以是字串(string)、字串列表(array)或檔案(file)。具體如下: 當輸入為字串時,最長支援 8,192 Token;當輸入為字串列表或檔案時,最多支援 10 條(行),每條(行)最長支援 8,192 Token。 |
|
|
dimensions 指定的向量維度,必須為以下值之一:2048(僅適用於 |
|
|
encoding_format 用於控制返回的Embedding格式,當前僅支援 |
響應對象 |
成功響應
異常響應
|
|
data 任務輸出資訊。 |
|
|
model 本次調用的模型名。 |
|
|
object string 本次調用返回的data類型,預設為list。 |
|
|
usage |
|
|
id string 請求唯一標識。可用於請求明細溯源和問題排查。 |
DashScope
使用SDK調用時需配置的base_url:
-
新加坡:https://dashscope-intl.aliyuncs.com/api/v1
-
華北2(北京):https://dashscope.aliyuncs.com/api/v1
-
中國香港:https://cn-hongkong.dashscope.aliyuncs.com/api/v1
使用HTTP方式調用時需配置的endpoint:
-
新加坡:POST https://dashscope-intl.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
-
華北2(北京):POST https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
-
中國香港:POST https://cn-hongkong.dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
請求體 |
輸入字串Python
Java
curl如果使用華北2(北京)地區的模型,請使用華北2(北京)地區的 API KEY,並將url替換為:https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
輸入字串列表Python
Java
curl如果使用華北2(北京)地區的模型,請使用華北2(北京)地區的 API KEY,並將url替換為:https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
輸入檔案Python
Java
curl如果使用華北2(北京)地區的模型,請使用華北2(北京)地區的 API KEY,並將url替換為:https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding 確保將 'texts_to_embedding.txt' 替換為您自己的檔案名稱或路徑
|
|
model 調用的模型,參考模型概覽表格中的模型名稱進行選擇。 |
|
|
input 輸入待處理的文本。可以是字串(string)、字串列表(array)或檔案(file)。具體如下: 當輸入為字串時,最長支援 8,192 Token;當輸入為字串列表或檔案時,最多支援 10 條(行),每條(行)最長支援 8,192 Token。 |
|
|
text_type 通過 HTTP 調用時,請將 text_type 放入parameters對象中。 文本轉換為向量後可以應用於檢索、聚類、分類等下遊任務,對檢索這類非對稱任務為了達到更好的檢索效果建議區分查詢文本(query)和底庫文本(document)類型,入庫、聚類、分類等對稱任務可以不用特殊指定,採用系統預設值 |
|
|
dimension 通過 HTTP 調用時,請將 dimension 放入parameters對象中。 指定的向量維度,必須為以下值之一:2048(僅適用於 |
|
|
output_type 通過 HTTP 調用時,請將 output_type 放入parameters對象中。 使用者指定輸出離散向量表示只適用於 |
|
|
instruct 添加自訂任務說明,可用於指導模型理解查詢意圖。建議使用英文撰寫,通常可帶來約 1%–5% 的效果提升。 |
響應對象 |
成功響應
異常響應
|
|
status_code 狀態代碼,表示請求的執行結果(如 200 表示成功)。 |
|
|
request_id 請求唯一標識。可用於請求明細溯源和問題排查。 |
|
|
code 請求失敗,表示錯誤碼,成功時返回參數中該參數為空白。 |
|
|
message 請求失敗,表示失敗詳細資料,成功時返回參數中該參數為空白。 |
|
|
output 任務輸出資訊。 |
|
|
usage |
錯誤碼
如果模型調用失敗並返回報錯資訊,請參見錯誤資訊進行解決。