全部產品
Search
文件中心

OpenSearch:Token計算

更新時間:Aug 06, 2025

您可以通過本文檔瞭解如何通過API計算您在調用AI搜尋開放平台服務時使用的Token數目 。

Token計算

在語言模型中,Token是指將輸入的文本分割成的最小單位。Token可以是一個單詞、一個片語、一個標點符號、一個字元等,不同模型可能有自己的切分方法,字元數目和Token數目不一定一一對應,例如在AI搜尋開放平台中:

  • “蘋果”對應1個Token

  • “測試案例”對應3個Token

  • “OpenSearch”對應2個Token

AI搜尋開放平台提供的大模型服務均基於使用者輸入和輸出的Token數目進行計量和計費,您可以通過Token計算API計算服務調用預計產生的費用。

已支援模型列表

以下模型支援使用Token計算服務擷取Token數目。

模型分類

服務ID(service_id)

OpenSearch SFT大模型

ops-qwen-turbo

通義千問大模型

qwen-turbo

qwen-plus

qwen-max

Http調用介面

前提條件

  • 擷取身份鑒權資訊

    通過API調用AI搜尋開放平台服務時,需要對調用者身份進行鑒權,如何擷取鑒權資訊請參見擷取API-KEY

  • 擷取服務調用地址

    支援通過公網和VPC兩種方式調用服務,詳情請參見擷取服務接入地址

公用說明

  • 請求body最大不能超過8MB。

請求方式

POST

URL

{host}/v3/openapi/workspaces/{workspace_name}/text-generation/{service_id}/tokenizer
  • host:調用服務的地址,支援通過公網和VPC兩種方式調用API服務,可參見擷取服務接入地址

    AI apikey截圖.png

  • workspace_name:工作空間名稱,例如default。

  • service_id: 系統內建服務id,例如ops-qwen-turbo。

請求參數

Hearder參數

API-KEY認證

參數

類型

必填

描述

樣本值

Content-Type

String

請求類型:application/json

application/json

Authorization

String

API-Key

Bearer OS-d1**2a

Body參數

messages

List

使用者與模型的對話歷史。list中的每個元素形式為{"role":角色, "content": 內容},角色當前可選值:system、user、assistant。

  • system:表示系統級訊息,只能用於對話歷史的第一條(messages[0])。使用system角色是可選的,如果存在,必須位於列表的最開始。

  • user和assistant:表示使用者和模型的對話。這兩類角色應交替出現在對話中,類比實際對話流程。

[{"role":

"user", "content":

"測試token計算介面"}]

返回參數

參數

類型

描述

樣本

request_id

String

系統對一次API調用賦予的唯一標識。

310032DA-****-46CC-94D1-0FE789BAE3A7

latency

Float/Int

請求耗時,單位ms。

10

usage

Object

本次調用產生的計量資訊。

"usage":{"input_tokens":4}

usage.input_tokens

Integer

使用者輸入文本轉換成Token後的長度。

4

result.token_ids

List<Integer>

本次輸入文本對應的token_ids。

[81705,5839,100768,107736]

result.tokens

List<String>

本次輸入文本對應的tokens。

["測試","token","計算","介面"]

Curl請求樣本

curl -XPOST -H "Content-Type:application/json" 
"http://****-shanghai.opensearch.aliyuncs.com/v3/openapi/workspaces/default/text-generation/ops-qwen-turbo/tokenizer" 
-H "Authorization: Bearer 您的API-KEY" 
-d "{
    \"messages\":[
                    {
                        \"role\":\"user\",
                        \"content\":\"測試token計算介面\"
                    }
    ]}"

響應樣本

正確響應樣本

{
  "request_id":"9d197d47-d6b5-****-964e-12b893c47a8b",
  "latency":11,
  "usage":{
    "input_tokens":4
  },
  "result":{
    "token_ids":[81705,5839,100768,107736],
    "tokens":["測試","token","計算","介面"]
  }
}

異常響應樣本

在訪問請求出錯的情況下,輸出的結果中會通過code和message指明出錯原因。

{
  "request_id":"388476DB-C4D4-****-A7A6-7594F92885FA",
  "latency":0,
  "code":"InvalidParameter",
  "message":"Messages must be end with role[user]."
}

狀態代碼說明

請參見AI搜尋開放平台狀態代碼說明