通用文本向量模型可将文本数据转换为数值向量,用于语义搜索、推荐、聚类、分类等下游任务。
模型概览
新加坡
|
模型名称 |
向量维度 |
最大行数 |
单行最大处理Token数(注) |
单价(每百万输入Token) |
支持语种 |
免费额度(注) |
|
text-embedding-v4 属于Qwen3-Embedding系列 |
2,048、1,536、1,024(默认)、768、512、256、128、64 |
10 |
8,192 |
$0.07 |
中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等100+主流语种 |
100万Token 有效期:百炼开通后90天内 |
|
text-embedding-v3 |
1,024(默认)、768、512 |
中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等50+主流语种 |
50万Token 有效期:百炼开通后90天内 |
北京
|
模型名称 |
向量维度 |
最大行数 |
单行最大Token数 |
单价(每百万输入Token) |
支持语种 |
|
text-embedding-v4 属于Qwen3-Embedding系列 |
2,048、1,536、1,024(默认)、768、512、256、128、64 |
10 |
8,192 |
$0.072 |
中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等100+主流语种及多种编程语言 |
关于模型限流,请参考限流。
前提条件
若熟悉OpenAI生态,可使用兼容API快速迁移;DashScope API则提供更丰富的独有特性。请根据您的需求选择。
您需要已获取API Key并配置API Key到环境变量。如果通过SDK调用,还需要安装DashScope SDK。
OpenAI兼容
使用SDK调用时需配置的base_url:
-
新加坡:https://dashscope-intl.aliyuncs.com/compatible-mode/v1
-
华北2(北京):https://dashscope.aliyuncs.com/compatible-mode/v1
使用HTTP方式调用时需配置的endpoint:
-
新加坡:POST https://dashscope-intl.aliyuncs.com/compatible-mode/v1/embeddings
-
华北2(北京):POST https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings
请求体 |
输入字符串Python
Java
curl如果使用华北2(北京)地域的模型,请使用华北2(北京)地域的 API KEY,并将url替换为:https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings
输入字符串列表Python
Java
curl如果使用华北2(北京)地域的模型,请使用华北2(北京)地域的 API KEY,并将url替换为:https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings
输入文件Python
Java
curl如果使用华北2(北京)地域的模型,请使用华北2(北京)地域的 API KEY,并将url替换为:https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings 确保将 'texts_to_embedding.txt' 替换为您自己的文件名或路径
|
|
model 调用的模型名称,参考模型概览表格中的模型名称进行选择。 |
|
|
input 输入待处理的文本。可以是字符串(string)、字符串列表(array)或文件(file)。具体如下: 当输入为字符串时,最长支持 8,192 Token;当输入为字符串列表或文件时,最多支持 10 条(行),每条(行)最长支持 8,192 Token。 |
|
|
dimensions 指定的向量维度,必须为以下值之一:2048(仅适用于 |
|
|
encoding_format 用于控制返回的Embedding格式,当前仅支持 |
响应对象 |
成功响应
异常响应
|
|
data 任务输出信息。 |
|
|
model 本次调用的模型名。 |
|
|
object string 本次调用返回的data类型,默认为list。 |
|
|
usage |
|
|
id string 请求唯一标识。可用于请求明细溯源和问题排查。 |
DashScope
使用SDK调用时需配置的base_url:
-
新加坡:https://dashscope-intl.aliyuncs.com/api/v1
-
华北2(北京):https://dashscope.aliyuncs.com/api/v1
使用HTTP方式调用时需配置的endpoint:
-
新加坡:POST https://dashscope-intl.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
-
华北2(北京):POST https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
请求体 |
输入字符串Python
Java
curl如果使用华北2(北京)地域的模型,请使用华北2(北京)地域的 API KEY,并将url替换为:https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
输入字符串列表Python
Java
curl如果使用华北2(北京)地域的模型,请使用华北2(北京)地域的 API KEY,并将url替换为:https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
输入文件Python
Java
curl如果使用华北2(北京)地域的模型,请使用华北2(北京)地域的 API KEY,并将url替换为:https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding 确保将 'texts_to_embedding.txt' 替换为您自己的文件名或路径
|
|
model 调用的模型,参考模型概览表格中的模型名称进行选择。 |
|
|
input 输入待处理的文本。可以是字符串(string)、字符串列表(array)或文件(file)。具体如下: 当输入为字符串时,最长支持 8,192 Token;当输入为字符串列表或文件时,最多支持 10 条(行),每条(行)最长支持 8,192 Token。 |
|
|
text_type 通过 HTTP 调用时,请将 text_type 放入parameters对象中。 文本转换为向量后可以应用于检索、聚类、分类等下游任务,对检索这类非对称任务为了达到更好的检索效果建议区分查询文本(query)和底库文本(document)类型,入库、聚类、分类等对称任务可以不用特殊指定,采用系统默认值 |
|
|
dimension 通过 HTTP 调用时,请将 dimension 放入parameters对象中。 指定的向量维度,必须为以下值之一:2048(仅适用于 |
|
|
output_type 通过 HTTP 调用时,请将 output_type 放入parameters对象中。 用户指定输出离散向量表示只适用于 |
|
|
instruct 添加自定义任务说明,可用于指导模型理解查询意图。建议使用英文撰写,通常可带来约 1%–5% 的效果提升。 |
响应对象 |
成功响应
异常响应
|
|
status_code 状态码,表示请求的执行结果(如 200 表示成功)。 |
|
|
request_id 请求唯一标识。可用于请求明细溯源和问题排查。 |
|
|
code 请求失败,表示错误码,成功时返回参数中该参数为空。 |
|
|
message 请求失败,表示失败详细信息,成功时返回参数中该参数为空。 |
|
|
output 任务输出信息。 |
|
|
usage |
错误码
如果模型调用失败并返回报错信息,请参见错误信息进行解决。