通過閱讀本文,您可以快速瞭解AI搜尋開放平台的計費項目組成、計費方式、計費規則資訊。
計費項目
AI搜尋開放平台涉及以下計費項目:
模型調用:調用模型(如文檔內容解析服務、文本向量化服務、排序服務等)服務產生的費用。
模型定製(僅上海地區):使用者結合自有資料對AI搜尋開放平台提供的模型進行模型定製(如向量降維服務定製訓練)產生的費用。
模型部署(僅上海地區):將不同渠道的模型獨立部署至AI搜尋開放平台所產生的部署和調用費用。
服務開發(僅上海地區):AI搜尋開放平台整合PAI DSW功能,開發人員可以在平台內通過Notebook完成服務開發與執行。
AI搜尋開放平台可免費開通,不使用不計費。
計費方式
除搜尋引擎服務外,AI搜尋開放平台均採用隨用隨付模式,按照服務調用量與模型定製訓練實際消耗的計算時(CU)計費。每小時產生一個計費賬單,所有的分時賬單歸屬於一個訂單,並按照產生訂單時的賬單從阿里雲帳號計費。
自2024-07-04 17:00起,部分服務採用階梯計費,具體請參見以下計費規則文檔。
計費規則
模型調用
在大語言模型中,Token是模型處理和理解文本的最小單位。通常表示單詞、字詞、字元或符號等文本片段,不同模型可能有自己的切分方法,字元數目和Token數目不一定一一對應。
AI搜尋開放平台模型調用涉及的Token計費單位為美元/千tokens,部分服務採用階梯計費,部分服務按輸入與輸出token計費。
部分模型支援Token計算預估調用產生的Token數。
階梯計費樣本:
在德國(法蘭克福)地區,調用文本稀疏向量服務,產生了1000000個token,共計為1000個計費單位,則計費為:500*0.001+500*0.0004=0.7美元
輸入輸出計費樣本:
在德國(法蘭克福)地區,調用大語言模型qwen3-235b-a22b,產生了輸入與輸出各1000個token,則計費為:
1*0.0007+1*0.0028=0.0035美元
德國(法蘭克福)地區
模型名稱 | 模型ID | 計費單位 | 0-500個單位定價 | 超出500個單位定價 |
ops-document-analyze-001 | 美元/千tokens | 0.0009 | 0.000272 | |
美元/張圖片 | 0.00073 | |||
美元/個表格 | 0.00157 | |||
說明 調用文檔內容解析服務時通過參數控制是否啟用基於語義理解的文檔層級結構提取功能,啟用後,除產生文檔解析費用以外,該功能按照0.00052美元/千tokens計費。 | 美元/千tokens | 0.00052 | ||
ops-image-analyze-ocr-001 | 美元/次 | 0.012 | 0.0031 | |
ops-image-analyze-vlm-001 | 美元/千tokens | 0.011 | ||
ops-document-split-001 | 美元/千tokens | 0.0009 | 0.000003 | |
ops-text-embedding-001 | 美元/千tokens | 0.0009 | 0.000072 | |
ops-text-embedding-002 | 0.0009 | 0.000054 | ||
ops-text-embedding-zh-001 | 0.0009 | 0.000022 | ||
ops-text-embedding-en-001 | 0.0009 | 0.000019 | ||
ops-gte-sentence-embedding-multilingual-base | 0.0009 | 0.00003 | ||
ops-qwen3-embedding-0.6b | 0.0009 | 0.000062 | ||
用於文本和圖片向量化 | ops-m2-encoder 文本向量化 | 美元/千tokens | 0.0009 | 0.000039 |
ops-m2-encoder 圖片向量化 | 美元/張圖片 | 0.0009 | 0.000032 | |
ops-m2-encoder-large 文本向量化 | 美元/千tokens | 0.0009 | 0.000065 | |
ops-m2-encoder-large 圖片向量化 | 美元/張圖片 | 0.0009 | 0.000042 | |
ops-gme-qwen2-vl-2b-instruct 文本向量化 | 美元/千tokens | 0.0009 | 0.000162 | |
ops-gme-qwen2-vl-2b-instruct 圖片向量化 | 美元/張圖片 | 0.0009 | 0.000146 | |
ops-text-sparse-embedding-001 | 美元/千tokens | 0.001 | 0.0004 | |
ops-embedding-dim-reduction-001 | 美元/個docs | 0.0009 | 0.0000064 | |
ops-bge-reranker-larger | 美元/個docs | 0.0005 | 0.000048 | |
ops-text-reranker-001 | 0.0005 | 0.00016 | ||
ops-qwen3-reranker-0.6b | 0.0005 | 0.000026 | ||
ops-video-snapshot-001 | 美元/千張 | 0.03 | ||
ops-audio-asr-001 | 美元/小時 | 0.2 | ||
搜尋引擎 | Elasticsearch:基於開源Elasticsearch構建的全託管雲端服務,100%相容開源功能的同時,支援開箱即用、按需付費,詳情請參見阿里雲ES。 | |||
OpenSearch-向量檢索版:計費詳情請參見向量檢索版。 | ||||
qwen3-235b-a22b | 美元/千tokens | 輸入:0.0007 輸出:0.0028 | ||
ops-qwen-turbo | 輸入:0.000065 輸出:0.00026 | |||
qwen-turbo | 輸入:0.00005 輸出:0.0002 | |||
qwen-plus | 輸入:0.0004 輸出:0.0012 | |||
qwen-max | 輸入:0.0016 輸出:0.0064 | |||
ops-query-analyze-001 | 美元/千tokens | 輸入:0.004 輸出:0.018 | ||
華東2(上海)地區
模型名稱 | 模型ID | 計費單位 | 0-500個單位定價 | 超出500個單位定價 |
ops-document-analyze-001 | 美元/千tokens | 0.0007 | 0.00085 | |
美元/張圖片 | 0.0023 | |||
美元/個表格 | 0.005 | |||
說明 調用文檔內容解析服務時通過參數控制是否啟用基於語義理解的文檔層級結構提取功能,啟用後,除產生文檔解析費用以外,該功能按照0.00031美元/千tokens計費。 | 美元/千tokens | 0.00031 | ||
ops-image-analyze-ocr-001 | 美元/次 | 0.0112 | 0.0058 | |
ops-image-analyze-vlm-001 | 美元/千tokens | 0.0093 | ||
ops-document-split-001 | 美元/千tokens | 0.0007 | 0.000003 | |
ops-text-embedding-001 | 美元/千tokens | 0.0007 | 0.000023 | |
ops-text-embedding-002 | 0.0007 | 0.00007 | ||
ops-text-embedding-zh-001 | 0.0007 | 0.00001 | ||
ops-text-embedding-en-001 | 0.0007 | 0.000011 | ||
ops-gte-sentence-embedding-multilingual-base | 0.0007 | 0.000025 | ||
ops-qwen3-embedding-0.6b | 0.0007 | 0.000071 | ||
用於文本和圖片向量化 | ops-m2-encoder 文本向量化 | 美元/千tokens | 0.0007 | 0.000026 |
ops-m2-encoder 圖片向量化 | 美元/張圖片 | 0.0007 | 0.0000162 | |
ops-m2-encoder-large 文本向量化 | 美元/千tokens | 0.0007 | 0.000067 | |
ops-m2-encoder-large 圖片向量化 | 美元/張圖片 | 0.0007 | 0.000033 | |
ops-gme-qwen2-vl-2b-instruct 文本向量化 | 美元/千tokens | 0.0007 | 0.00008 | |
ops-gme-qwen2-vl-2b-instruct 圖片向量化 | 美元/張圖片 | 0.0007 | 0.000072 | |
ops-text-sparse-embedding-001 | 美元/千tokens | 0.00084 | 0.00014 | |
ops-embedding-dim-reduction-001 | 美元/個docs | 0.0007 | 0.0000071 | |
ops-bge-reranker-larger | 美元/個docs | 0.00014 | 0.000013 | |
ops-text-reranker-001 | 0.00014 | 0.000062 | ||
ops-qwen3-reranker-0.6b | 0.00014 | 0.000015 | ||
ops-video-snapshot-001 | 美元/千張 | 0.016 | ||
ops-audio-asr-001 | 美元/小時 | 0.09 | ||
搜尋引擎 | Elasticsearch:基於開源Elasticsearch構建的全託管雲端服務,100%相容開源功能的同時,支援開箱即用、按需付費,詳情請參見阿里雲ES。 | |||
OpenSearch-向量檢索版:計費詳情請參見向量檢索版。 | ||||
qwen3-235b-a22b | 美元/千tokens | 輸入:0.00056 輸出:0.0056 | ||
qwq-32b | 輸入:0.00028 輸出:0.00084 | |||
ops-qwen-turbo | 輸入:0.00006 輸出:0.0001 | |||
qwen-turbo | 輸入:0.000042 輸出:0.000084 | |||
qwen-plus | 輸入:0.000112 輸出:0.00028 | |||
qwen-max | 輸入:0.000336 輸出:0.001344 | |||
deepseek-r1 | 輸入:0.00056 輸出:0.00224 | |||
deepseek-r1-distill-qwen-7b | 輸入:0.00007 輸出:0.00014 | |||
deepseek-r1-distill-qwen-14b | 輸入:0.00014 輸出:0.00042 | |||
deepseek-v3 | 輸入:0.00028 輸出:0.00112 | |||
| 美元/次 | 0.00735 | ||
美元/千tokens | Query改寫: 輸入:0.000336 輸出:0.001344 | |||
ops-query-analyze-001 | 美元/千tokens | 意圖理解、相似問題擴充:
| ||
NL2SQL產生:
| ||||
通過效果評測模組對AI搜尋開放平台提供的RAG開發鏈路進行效果測評,從使用者提出問題開始,到RAG系統召回內容,再到LLM產生回答的整個流程進行綜合評測。 | 美元/千tokens | 輸入:0.0007 輸出:0.0021 | ||
模型定製
模型名稱 | 說明 | 價格 |
向量降維模型定製訓練支援結合使用者提供的向量資料,定製向量降維模型。實際業務情境中,先通過向量化模型對文本或者Query向量化,然後結合向量降維模型進一步降低向量維度。 | 按照實際消耗的計算資源CU數計費,每CU價格為0.5422614美元。 實際消耗的CU數取決於訓練的資料量和維度,按照最小化訓練10萬條1024維資料,需消耗約250個CU,產生費用為250*0.5422614=135.56535美元。 |
模型部署
計費公式為:CU單價*機型消耗的CU數量*購買機器台數
具體計費規則如下表所示:
機型 | CU單價(美元/小時) | 單台機器消耗CU數量 | 單台機器單價(美元/小時) |
gpu.v100.16g.x1 | 0.15 | 30.14 | 4.521 |
gpu.t4.16g.x1 | 16.07 | 2.4105 | |
gpu.a10.24g.x1 | 11.01 | 1.6515 |
例如某使用者購買2台gpu.a10.24g.x1部署模型服務,計費為:0.15*11.01*2=3.303美元/小時。
服務開發
執行個體啟動後按照機型、消耗的CU數以及使用時間長度隨用隨付,計費公式為:CU單價*機型消耗的CU數量*購買機器台數。
具體計費規則如下表所示:
機型 | CU單價(美元/小時) | 單台機器消耗CU數量 | 單台機器單價(美元/小時) |
gpu.t4.16g.x1 | 0.15 | 16.07 | 2.4105 |
ops.basic1.gi.large | 0.61 | 0.0915 |
例如某使用者的執行個體中選擇1台ops.basic1.gi.large,計費為:0.15*0.61*1=0.0915美元/小時。
注意事項
服務名稱與服務ID以及服務的API參數一一對應,詳情請參見服務概覽。
計費賬單按照調用服務要求的實際使用量推送,每小時產生一個計費賬單。
涉及階梯計費的服務,系統按照階梯推送賬單。
部分服務以千tokens作為計費單位,統計用量時可能出現小數。
請確保阿里雲帳號處於未欠費狀態,避免影響搜尋服務的正常使用。
計費樣本
假設某使用者在德國(法蘭克福)地區,調用了1000個單位的文檔切片服務,產生的費用如下:
500個單位(含500)的費用:0.0009美元*500=0.45美元
500個單位以上的費用:0.000003美元*500=0.0015美元
總費用:0.45+0.0015=0.4515美元