汎用テキスト埋め込みモデルは、意味検索、レコメンデーション、クラスタリング、分類などの下流タスク向けに、テキストデータを数値ベクトルに変換します。
モデル概要
シンガポール
|
モデル |
埋め込み次元 |
最大行数 |
1 行あたりの最大トークン数(注) |
価格(入力トークン 100 万個あたり) |
対応言語 |
無料クォータ(注) |
|
text-embedding-v4 「Qwen3-Embedding」シリーズの一部 |
2,048、1,536、1,024(デフォルト)、768、512、256、128、64 |
10 |
8,192 |
$0.07 |
中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語、およびその他の主要言語 100 以上 |
100 万トークン 有効期限:Model Studio を有効化した日から 90 日間 |
|
text-embedding-v3 |
1,024(デフォルト)、768、512 |
中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語、およびその他の主要言語 50 以上 |
50 万トークン 有効期限:Model Studio を有効化した日から 90 日間 |
北京
|
モデル |
埋め込み次元 |
最大行数 |
1 行あたりの最大トークン数 |
価格(入力トークン 100 万個あたり) |
対応言語 |
|
text-embedding-v4 「Qwen3-Embedding」シリーズの一部 |
2,048、1,536、1,024(デフォルト)、768、512、256、128、64 |
10 |
8,192 |
$0.072 |
中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語、およびその他の主要言語 100 以上と複数のプログラミング言語 |
中国(香港)
|
モデル |
埋め込み次元 |
最大行数 |
1 行あたりの最大トークン数 |
価格(入力トークン 100 万個あたり) |
対応言語 |
|
text-embedding-v4 「Qwen3-Embedding」シリーズの一部 |
2,048、1,536、1,024(デフォルト)、768、512、256、128、64 |
10 |
8,192 |
$0.07 |
中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語、およびその他の主要言語 100 以上と複数のプログラミング言語 |
モデルのレート制限について詳しくは、「レート制限」をご参照ください。
前提条件
OpenAI エコシステムに慣れている場合は、迅速な移行のために OpenAI 互換 API を使用できます。DashScope API には追加の独自機能が提供されます。ご要件に最も適した API を選択してください。
API キーの取得およびAPI キーを環境変数としてエクスポートしてください。SDK を使用して呼び出しを行う場合は、DashScope SDK のインストールが必要です。
OpenAI 互換
SDK 呼び出しで設定する base_url:
-
シンガポール:https://dashscope-intl.aliyuncs.com/compatible-mode/v1
-
中国(北京):https://dashscope.aliyuncs.com/compatible-mode/v1
-
中国(香港):https://cn-hongkong.dashscope.aliyuncs.com/compatible-mode/v1
HTTP 呼び出しで設定するエンドポイント:
-
シンガポール:POST https://dashscope-intl.aliyuncs.com/compatible-mode/v1/embeddings
-
中国(北京):POST https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings
-
中国(香港):POST https://cn-hongkong.dashscope.aliyuncs.com/compatible-mode/v1/embeddings
リクエストボディ |
入力文字列Python
Java
curl中国(北京)リージョンのモデルを使用する場合は、API キーをそのリージョン専用に取得し、URL を以下に置き換えてください:https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings
入力文字列リストPython
Java
curl中国(北京)リージョンのモデルを使用する場合は、API キーをそのリージョン専用に取得し、URL を以下に置き換えてください:https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings
入力ファイルPython
Java
curl中国(北京)リージョンのモデルを使用する場合は、API キーをそのリージョン専用に取得し、URL を以下に置き換えてください:https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings 'texts_to_embedding.txt' を実際のファイル名またはパスに置き換えてください。
|
|
model 呼び出すモデルの名前です。「モデル概要」表からモデル名を選択してください。 |
|
|
input 処理対象のテキストです。テキストは文字列、文字列の配列、またはファイルのいずれかになります。以下に説明します。 入力が文字列の場合、最大 8,192 トークンをサポートします。入力が文字列のリストまたはファイルの場合、最大 10 アイテム(行)をサポートし、各アイテム(行)は最大 8,192 トークンをサポートします。 |
|
|
dimensions 出力ベクトルの次元数です。値は、2,048( |
|
|
encoding_format 返される埋め込みのフォーマットを指定します。 |
応答オブジェクト |
成功時の応答
エラー応答
|
|
data タスクの出力情報です。 |
|
|
model この呼び出しで使用されたモデルの名前です。 |
|
|
object string 返されるデータのタイプです。デフォルト値は `list` です。 |
|
|
usage |
|
|
id string 一意の要求識別子です。この識別子は要求のトレースおよびトラブルシューティングに使用できます。 |
DashScope
SDK 呼び出しで設定する base_url:
-
シンガポール:https://dashscope-intl.aliyuncs.com/api/v1
-
中国(北京):https://dashscope.aliyuncs.com/api/v1
-
中国(香港):https://cn-hongkong.dashscope.aliyuncs.com/api/v1
HTTP 呼び出しで設定するエンドポイント:
-
シンガポール:POST https://dashscope-intl.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
-
中国(北京):POST https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
-
中国(香港):POST https://cn-hongkong.dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
リクエストボディ |
入力文字列Python
Java
curl中国(北京)リージョンのモデルを使用する場合は、API キーをそのリージョン専用に取得し、URL を以下に置き換えてください:https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
入力文字列リストPython
Java
curl中国(北京)リージョンのモデルを使用する場合は、API キーをそのリージョン専用に取得し、URL を以下に置き換えてください:https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
入力ファイルPython
Java
curl中国(北京)リージョンのモデルを使用する場合は、API キーをそのリージョン専用に取得し、URL を以下に置き換えてください:https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding 'texts_to_embedding.txt' を実際のファイル名またはパスに置き換えてください。
|
|
model 呼び出すモデルです。「モデル概要」表からモデル名を選択してください。 |
|
|
input 処理対象のテキストです。テキストは文字列、文字列の配列、またはファイルのいずれかになります。以下に説明します。 文字列入力は最大 8,192 トークンを含むことができます。文字列のリストまたはファイル入力は最大 10 アイテムまたは行を含むことができ、各アイテムまたは行は最大 8,192 トークンを含むことができます。 |
|
|
text_type HTTP 経由で呼び出しを行う場合、text_type を `parameters` オブジェクト内に配置します。 テキストをベクトルに変換した後、取得したベクトルは取得、クラスタリング、分類などの下流タスクに使用できます。取得などの非対称タスクでは、クエリテキスト(`query`)とドキュメントテキスト(`document`)を区別することで、より優れた結果を得ることができます。インデックス作成、クラスタリング、分類などの対称タスクでは、デフォルト値 |
|
|
dimension HTTP 経由で呼び出しを行う場合、dimension を `parameters` オブジェクト内に配置します。 出力ベクトルの次元数です。値は、2,048(`text-embedding-v4` のみ)、1,536(`text-embedding-v4` のみ)、1,024、768、512、256、128、64 のいずれかである必要があります。デフォルト値は 1,024 です。 |
|
|
output_type HTTP 経由で呼び出しを行う場合、output_type を `parameters` オブジェクト内に配置します。 疎ベクトル表現を出力するかどうかを指定します。このパラメーターは |
|
|
instruct クエリの意図を理解するようモデルをガイドするカスタムタスク命令を追加できます。英語で命令を記述すると、性能向上が 1%~5% 期待できます。 |
応答オブジェクト |
成功時の応答
エラー応答
|
|
status_code 要求の結果を示すステータスコードです。たとえば、ステータスコード 200 は要求が成功したことを示します。 |
|
|
request_id 一意の要求識別子です。この識別子は要求のトレースおよびトラブルシューティングに使用できます。 |
|
|
code 要求が失敗した場合に返されるエラーコードです。要求が成功した場合は、このパラメーターは空になります。 |
|
|
message 要求が失敗した場合に返される詳細なエラーメッセージです。要求が成功した場合は、このパラメーターは空になります。 |
|
|
output タスクの出力情報です。 |
|
|
usage |
エラーコード
モデル呼び出しが失敗し、エラーが返された場合は、「エラーメッセージ」を参照して解決策をご確認ください。