汎用テキスト埋め込みモデルは、テキストデータを数値ベクトルに変換し、セマンティック検索、レコメンデーション、クラスタリング、分類などのダウンストリームタスクに活用します。
モデル概要
シンガポール
モデル | 埋め込み次元 | 最大行数 | 1 行あたりの最大トークン数 (注記) | 料金 (1M 入力トークンあたり) | サポート言語 | 無料クォータ (注記) |
text-embedding-v4 Qwen3-Embedding シリーズの一部 | 2,048、1,536、1,024 (デフォルト)、768、512、256、128、64 | 10 | 8,192 | $0.07 | 中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語、およびその他の主要言語 100 言語以上 | 100 万トークン 有効期間: Model Studio のアクティベート後 90 日間 |
text-embedding-v3 | 1,024 (デフォルト)、768、512 | 中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語、およびその他の主要言語 50 言語以上 | 50 万トークン 有効期間: Model Studio のアクティベート後 90 日間 |
中国 (北京)
モデル | 埋め込み次元 | 最大行数 | 1 行あたりの最大トークン数 | 料金 (1M 入力トークンあたり) | サポート言語 |
text-embedding-v4 Qwen3-Embedding シリーズの一部 | 2,048、1,536、1,024 (デフォルト)、768、512、256、128、64 | 10 | 8,192 | $0.072 | 中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語、およびその他の主要言語 100 言語以上、さらに複数のプログラミング言語 |
中国 (香港)
モデル | 埋め込み次元 | 最大行数 | 1 行あたりの最大トークン数 | 料金 (1M 入力トークンあたり) | サポート言語 |
text-embedding-v4 Qwen3-Embedding シリーズの一部 | 2,048、1,536、1,024 (デフォルト)、768、512、256、128、64 | 10 | 8,192 | $0.07 | 中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語、およびその他の主要言語 100 言語以上、さらに複数のプログラミング言語 |
モデルのレート制限については、「レート制限」をご参照ください。
前提条件
OpenAI エコシステムに慣れているユーザーは、OpenAI 互換 API を使用して迅速に移行できます。DashScope API はより多くの独自機能を提供します。
API キーを作成し、環境変数として API キーをエクスポートします。SDK を使用して呼び出す場合は、DashScope SDK をインストールしてください。
OpenAI 互換性
SDK 呼び出し用に設定する base_url:
シンガポール: https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1。
WorkspaceIdは実際の ワークスペース ID に置き換えてください。中国 (北京): https://dashscope.aliyuncs.com/compatible-mode/v1
中国 (香港): https://{WorkspaceId}.cn-hongkong.maas.aliyuncs.com/compatible-mode/v1。
WorkspaceIdは実際の ワークスペース ID に置き換えてください。
HTTP 呼び出し用に設定する エンドポイント:
シンガポール: POSThttps://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1/embeddings。
WorkspaceIdは実際の ワークスペース ID に置き換えてください。中国 (北京): POSThttps://dashscope.aliyuncs.com/compatible-mode/v1/embeddings
中国 (香港): POST https://{WorkspaceId}.cn-hongkong.maas.aliyuncs.com/compatible-mode/v1/embeddings。
WorkspaceIdは実際の ワークスペース ID に置き換えてください。
レガシのシンガポールドメイン https://dashscope-intl.aliyuncs.com および中国 (香港) ドメイン https://cn-hongkong.dashscope.aliyuncs.com は廃止予定です。できるだけ早く https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com (シンガポール) および https://{WorkspaceId}.cn-hongkong.maas.aliyuncs.com (中国 (香港)) に移行してください。
リクエストボディ | 入力文字列PythonJavacurl中国 (北京) リージョンのモデルを使用する場合は、必ずそのリージョンの API キー を使用し、URL を 入力文字列リストPythonJavacurl中国 (北京) リージョンのモデルを使用する場合は、必ずそのリージョンの API キー を使用し、URL を 入力ファイルPythonJavacurl中国 (北京) リージョンのモデルを使用する場合は、必ずそのリージョンの API キー を使用し、URL を 'texts_to_embedding.txt' は実際のファイル名またはパスに置き換えてください。 |
model 呼び出すモデルの名前。「モデル概要」表を参照してください。 | |
input 処理する入力テキスト。入力は文字列、文字列の配列、またはファイルです。 入力が文字列の場合、最大長は 8,192 トークンです。入力が文字列リストまたはファイルの場合、最大バッチサイズは 10 項目 (行) で、各項目 (行) は最大 8,192 トークンを含めることができます。 | |
dimensions 出力埋め込みベクトルの次元。以下のいずれかの値である必要があります: 2048 ( | |
encoding_format 返される埋め込みのフォーマット。現在、 |
応答オブジェクト | 成功時の応答エラー時の応答 |
data 結果となる埋め込みオブジェクトのリスト。 | |
model この呼び出しで使用されたモデルの名前。 | |
object string オブジェクトタイプ。値は常に | |
usage | |
id string 一意のリクエスト識別子。トレースおよびトラブルシューティングに使用されます。 |
DashScope
base_url (SDK 呼び出し用):
シンガポール: https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1。
WorkspaceIdは実際の ワークスペース ID に置き換えてください。中国 (北京): https://dashscope.aliyuncs.com/api/v1
中国 (香港): https://{WorkspaceId}.cn-hongkong.maas.aliyuncs.com/api/v1。
WorkspaceIdは実際の ワークスペース ID に置き換えてください。
エンドポイント (HTTP 呼び出し用):
シンガポール: POST https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding。
WorkspaceIdは実際の ワークスペース ID に置き換えてください。中国 (北京): POST https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
中国 (香港): POST https://{WorkspaceId}.cn-hongkong.maas.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding。
WorkspaceIdは実際の ワークスペース ID に置き換えてください。
中国 (香港) のレガシー URL https://cn-hongkong.dashscope.aliyuncs.com/api/v1 は近日中に非推奨になります。新しい URL https://{WorkspaceId}.cn-hongkong.maas.aliyuncs.com/api/v1 にできるだけ早く移行してください。
シンガポールリージョンのレガシードメイン https://dashscope-intl.aliyuncs.com は近日中に非推奨になります。新しいドメイン https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com にできるだけ早く移行してください。
リクエストボディ | 入力文字列PythonJavacurl中国 (北京) リージョンのモデルを使用する場合は、そのリージョンの API キー を使用し、URL を次のように置き換えてください: https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding。これはシンガポールリージョンの URL です。WorkspaceId は実際のワークスペース ID に置き換えてください。URL はリージョンによって異なります。 入力文字列リストPythonJavacurl中国 (北京) リージョンのモデルを使用する場合は、そのリージョンの API キー を使用し、URL を次のように置き換えてください: https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding。これはシンガポールリージョンの URL です。WorkspaceId は実際のワークスペース ID に置き換えてください。URL はリージョンによって異なります。 入力ファイルPythonJavacurl中国 (北京) リージョンのモデルを使用する場合は、そのリージョンの API キー を使用し、URL を次のように置き換えてください: https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding。これはシンガポールリージョンの URL です。WorkspaceId は実際のワークスペース ID に置き換えてください。URL はリージョンによって異なります。 'texts_to_embedding.txt' は実際のファイル名またはパスに置き換えてください。 |
model 使用するモデル。利用可能なモデルの一覧については、「モデル概要」表をご参照ください。 | |
input 処理するテキスト。入力は文字列、文字列の配列、またはファイルです。 単一の文字列は最大 8,192 トークンまで可能です。文字列リストまたはファイルは最大 10 項目 (行) を含めることができ、各項目は最大 8,192 トークンまで可能です。 | |
text_type HTTP 呼び出しを行う場合、text_type は 埋め込みに変換されたテキストは、取得、クラスタリング、分類などのダウンストリームタスクに適用できます。取得などの非対称タスクでは、クエリテキスト (query) とドキュメントテキスト (document) を区別することを推奨します。これにより、取得パフォーマンスが向上します。インデックス作成、クラスタリング、分類などの対称タスクでは、システムのデフォルト値 | |
dimension HTTP 呼び出しを行う場合、dimension は 出力ベクトルの埋め込み次元を指定します。有効な値は、2048 ( | |
output_type HTTP 呼び出しを行う場合、output_type は 出力ベクトルタイプを指定します。このパラメーターは | |
instruct モデルがクエリの意図を理解するようにガイドするためのカスタム命令を提供します。英語の命令を推奨します。通常、パフォーマンスが 1% ~ 5% 向上します。 |
応答オブジェクト | 成功時の応答エラー時の応答 |
status_code HTTP ステータスコード。200 の場合、成功を示します。 | |
request_id リクエストの一意識別子。この ID を使用してリクエストをトレースおよびトラブルシューティングできます。 | |
code リクエストが失敗した場合に返されるエラーコード。成功したリクエストでは、このフィールドは空です。 | |
message リクエストが失敗した場合に返される詳細なエラーメッセージ。成功したリクエストでは、このフィールドは空です。 | |
output タスクの結果。 | |
usage |
エラーコード
モデル呼び出しが失敗した場合は、「エラーメッセージ」をご参照ください。