全部產品
Search
文件中心

OpenSearch:服務定製

更新時間:Aug 22, 2025

模型定製支援通過使用者業務資料對文本向量化模型進行效果強化訓練,同時支援結合使用者提供的向量資料,定製訓練向量降維模型。實際業務情境中,先通過向量化模型對文本或者Query向量化,然後結合向量降維模型降低向量維度。

背景資訊

在智能搜尋和RAG情境中,向量模型的效果對業務效果至關重要。但通用向量模型在垂直領域的效果常受限於訓練資料覆蓋度。為提升業務檢索效果,可結合業務資料對通用模型進行定向微調。同時,向量模型的維度不斷增大,導致大規模資料向量化儲存和計算成本顯著增加。為此,AI搜尋開放平台提供向量降維服務,通過定製模型將高維向量轉化為較低維度向量,在不明顯降低向量化效果的前提下,節省使用者成本。

費用說明

按照訓練實際消耗的計算資源CU數計費,每CU價格為3.87元,實際消耗的CU數取決於訓練的資料量和維度。按照最小化訓練10萬條1024維資料,需消耗約250個CU,產生費用為250*3.87=967.5元。

向量降維服務定製

  1. AI搜尋開放平台選擇模型服務>模型定製,然後單擊建立

    如通過RAM帳號進行模型建立、變更配置、查看模型詳情等操作時,需要提前授予RAM帳號模型服務相關的操作許可權。

  2. 模型定製頁面,配置以下參數資訊。

    參數

    說明

    模型名稱

    後續調用向量降維服務時的模型名稱。

    模型類型

    訓練模型的類型,選擇向量降維(embedding-dim-reduction)

    模型服務

    用於訓練的基本模型,如ops-embedding-dim-reduction-001。

    訓練資料來源

    MaxCompute或OSS

    MaxCompute資料來源

    參數

    說明

    訓練資料來源

    MaxCompute。

    所在地區

    MaxCompute所屬地區。

    專案名

    MaxCompute中的專案名稱。

    AccessKeyId

    擁有讀寫MaxCompute許可權的阿里雲帳號或RAM帳號的AccessKey ID。

    您可以進入AccessKey管理頁面擷取AccessKeyId。

    Secret

    AccessKeyId對應的Secret。

    表名

    MaxCompute中儲存訓練資料的表的名稱。

    表分區

    表的分區資訊。

    訓練欄位

    需要提前為讀寫MaxCompute表結構的RAM帳號授予GetTableFields(擷取MaxCompute表結構)許可權,此處才能選擇主鍵欄位和String類型的向量欄位,向量欄位維度範圍為1024~4096維。

    OSS資料來源

    參數

    說明

    訓練資料來源

    OSS

    所在地區

    OSS所屬地區。

    OSS儲存空間(Bucket)

    OSS的Bucket名稱。

    doc資料

    OSS中用於訓練的資料。

    OSS訪問網域名稱(Endpoint)

    完成以上配置後產生。

  3. 單擊確定,二次彈窗選擇建立並訓練後模型進入預先處理狀態,預先處理完成後開始訓練。

    選擇確認建立後您可以在模型定製列表,找到待訓練的模型進行訓練。

    模型列表中,狀態為可用的模型,表示訓練完成且模型可被調用,單擊體驗,體驗向量微調模型效果

文本向量化服務定製

  1. AI搜尋開放平台選擇模型服務>模型定製,然後單擊建立

    如通過RAM帳號進行模型建立、變更配置、查看模型詳情等操作時,需要提前授予RAM帳號模型服務相關的操作許可權。

  2. 模型定製頁面,配置以下參數資訊。

    參數

    說明

    模型名稱

    可自訂。

    模型類型

    訓練模型的類型,選擇文本向量化(text-embedding)

    基本模型

    用於訓練的基本模型,如ops-text-embedding-001。

    向量降維

    開啟後可以同時進行向量降維訓練。

    降維基本模型

    向量降維選擇開啟時,用以降維的模型。

    訓練資料來源

    MaxCompute或OSS。

    MaxCompute資料來源

    參數

    說明

    訓練資料來源

    MaxCompute。

    所在地區

    MaxCompute所屬地區。

    專案名

    MaxCompute中的專案名稱。

    AccessKeyId

    擁有讀寫MaxCompute許可權的阿里雲帳號或RAM帳號的AccessKey ID。

    您可以進入AccessKey管理頁面擷取AccessKeyId。

    Secret

    AccessKeyId對應的Secret。

    表名

    MaxCompute中儲存訓練資料的表的名稱。

    表分區

    表的分區資訊。

    訓練欄位

    需要提前為讀寫MaxCompute表結構的RAM帳號授予GetTableFields(擷取MaxCompute表結構)許可權,此處才能選擇主鍵欄位和String類型的文本資料。

    query-doc對

    請參考控制台的樣本資料。

    OSS資料來源

    參數

    說明

    訓練資料來源

    OSS

    所在地區

    OSS所屬地區。

    OSS儲存空間(Bucket)

    OSS的Bucket名稱。

    doc資料

    OSS中用於訓練的資料。

    query-doc對

    請參考控制台的樣本資料。

    OSS訪問網域名稱(Endpoint)

    完成以上配置後系統產生。

  3. 單擊確定,二次彈窗選擇建立並訓練後模型進入預先處理狀態,預先處理完成後開始訓練。

    選擇確認建立後您可以在模型定製列表,找到待訓練的模型進行訓練。

    模型列表中,狀態為可用的模型,表示訓練完成且可被部署

服務調用

模型服務效果符合預期時,可以通過API調用服務,請參見向量降維服務API自訂部署服務API