全部產品
Search
文件中心

OpenSearch:服務概覽

更新時間:Aug 06, 2025

服務廣場彙集了AI搜尋開放平台的全量服務,無需登入阿里雲帳號即可進入服務廣場查閱各類服務詳情。

操作步驟

  1. 進入服務廣場查看AI搜尋開放平台提供的各類服務。

    服務類別

    服務說明

    文檔內容解析

    通用文檔解析服務,支援從非結構化文檔(文本、表格、圖片等)中提取標題、分段等邏輯層級結構,以結構化格式輸出。

    圖片內容解析

    圖片內容理解服務:基於多模態大模型對圖片內容進行解析理解以及文字識別,解析後的文本可用於圖片檢索、問答情境。

    圖片文本識別服務:OCR圖片文本識別,識別後的文本可用於圖片檢索問答情境。

    文檔切片

    提供通用文本切片服務,支援基於文檔段落、文本語義、指定規則,對HTML、Markdown、TXT格式的結構化資料進行拆分,同時支援以富文本形式提取文檔中的代碼、圖片以及表格。

    文本向量化

    • OpenSearch文本向量化服務-001:提供多語言(40+)文本向量化服務,輸入文本最大長度300 token,輸出向量維度1536維。

    • OpenSearch通用文本向量化服務-002:提供多語言(100+)文本向量化服務,輸入文本最大長度8192 token,輸出向量維度1024維。

    • OpenSearch文本向量化服務-中文-001:提供中文文本向量化服務,輸入文本最大長度1024 token,輸出向量維度768維。

    • OpenSearch文本向量化服務-英文-001:提供英文文本向量化服務,輸入文本最大長度512 token,輸出向量維度768維。

    • GTE文本向量-多語言-Base:多語言(70+)文本向量化服務,輸入文本最大長度8192,輸出向量維度768維。

    • Qwen3文本向量-0.6B:Qwen3系列多語言(100+)文本向量化服務,輸入最大長度32k,輸出向量維度可自訂32~1024維,參數量0.6B。

    多模態向量化

    • M2-Encoder-多模態向量模型:中英雙語多模態服務,基於60億圖文對資料(其中30億為中文資料,30億為英文資料)在BM-6B基礎上訓練而成。該模型支援圖文跨模態檢索(包括文本搜尋圖片和圖片搜尋文本),以及圖片分類任務。

    • M2-Encoder-Large-多模態向量模型:中英雙語多模態服務,相比M2-Encoder模型擁有更大的參數量,達到 1B(10億參數),從而在多模態任務處理中具備更強的表達能力和效能表現。

    文本稀疏向量化

    提供將文本資料轉化為稀疏向量形式表達的服務,稀疏向量儲存空間更小,常用於表達關鍵詞和詞頻資訊,可與稠密向量搭配進行混合檢索,提升檢索效果。

    OpenSearch文本稀疏向量化服務:提供多語言(100+)文本向量化服務,輸入文本最大長度8192 token。

    向量微調

    向量微調embedding-tuning:提供向量模型調優服務,可通過定製訓練向量降維等模型,在不帶來過多檢索效果損失的情況下,輔助將高維度向量降低維度,以便提升性價比。

    查詢分析

    提供Query內容分析服務,基於大語言模型及NLP能力,可對使用者輸入的查詢內容進行意圖識別、相似問題擴充、NL2SQL處理等,有效提升RAG情境中檢索問答效果。

    通用Query分析服務,基於大語言模型對使用者輸入Query進行意圖理解以及相似問題擴充。

    排序服務

    • BGE重排模型:提供基於BGE模型的文檔打分服務,可根據Query與文檔內容的相關性,按分數由高到低對DOC進行排序,並輸出對應的打分結果。支援中英雙語,最大輸入token長度512(Query+Doc長度)。

    • OpenSearch自研重排模型:融合多行業資料集訓練,提供高水準的重排服務,可根據Query及DOC的語義相關性從高到低對Doc進行排序。支援中英雙語,最大輸入token長度512(Query+doc長度)。

    • Qwen3排序服務-0.6B:Qwen3系列文檔重排服務,支援100+語言,最大輸入token長度32k(Query+doc長度),參數量0.6B。

    語音辨識

    語音辨識服務001:提供語音轉文本能力,可將視頻或音頻中的語音內容快速轉化為結構化文本。該服務支援多種語言。

    視頻截幀

    視頻截幀服務001:提供視頻內容提取能力,可從視頻中捕獲主要畫面格畫面。結合多模態向量服務或圖片解析能力,實現跨模態檢索。

    大模型

    • Qwen3-235B-A22B:新一代Qwen系列大型語言模型,基於廣泛的訓練,Qwen3在推理、指令跟隨、Agent能力和多語言支援方面取得了突破性進展,可支援100多種語言和方言,具備強大的多語言理解、推理和產生能力。

    • OpenSearch-通義千問-Turbo:以qwen-turbo大規模語言模型為模型底座,進行有監督的模型微調,強化檢索增強,減少有害性。

    • 通義千問-Turbo:通義千問系列速度最快、成本極低的模型,適合簡單任務,詳情請參見通義千問Turbo

    • 通義千問-Plus:能力均衡,推理效果、成本和速度介於通義千問-Max和通義千問-Turbo之間,適合中等複雜任務,詳情請參見通義千問Plus

    • 通義千問-Max:通義千問系列效果最好的模型,適合複雜、多步驟的任務,詳情請參見通義千問Max

    • QwQ深度思考模型:基於Qwen2.5-32B模型訓練的 QwQ 推理模型,通過強化學習大幅度提升了模型推理能力。

    • DeepSeek-R1:專註於複雜推理任務的大語言模型,在複雜指令理解、結果準確性等方面表現較突出。

    • DeepSeek-V3:MoE模型,在長文本、代碼、數學、百科、中文能力上表現優秀。

    • DeepSeek-R1-distill-qwen-7b:基於知識蒸餾技術,通過使用DeepSeek-R1產生的訓練樣本對Qwen-7B微調訓練的模型。

    • DeepSeek-R1-distill-qwen-14b:基於知識蒸餾技術,通過使用DeepSeek-R1產生的訓練樣本對Qwen-14B微調訓練的模型。

    連網搜尋

    搜尋過程中,當私人知識庫無法給出相應的答案時,可拓展連網搜尋,擷取更多互連網資訊,補充私人知識庫,結合大語言模型給出更豐富的回答。

  2. 選擇服務卡片左下角查看詳情,查看當前服務的服務名稱服務ID服務簡介以及收費方式

  3. 選擇服務卡片右上方體驗,可跳轉至體驗中心,對服務進行測試和效果預覽,詳情請參見體驗中心