服務廣場彙集了AI搜尋開放平台的全量服務,無需登入阿里雲帳號即可進入服務廣場查閱各類服務詳情。
操作步驟
進入服務廣場查看AI搜尋開放平台提供的各類服務。
服務類別
服務說明
文檔內容解析
通用文檔解析服務,支援從非結構化文檔(文本、表格、圖片等)中提取標題、分段等邏輯層級結構,以結構化格式輸出。
圖片內容解析
圖片內容理解服務:基於多模態大模型對圖片內容進行解析理解以及文字識別,解析後的文本可用於圖片檢索、問答情境。
圖片文本識別服務:OCR圖片文本識別,識別後的文本可用於圖片檢索問答情境。
文檔切片
提供通用文本切片服務,支援基於文檔段落、文本語義、指定規則,對HTML、Markdown、TXT格式的結構化資料進行拆分,同時支援以富文本形式提取文檔中的代碼、圖片以及表格。
文本向量化
OpenSearch文本向量化服務-001:提供多語言(40+)文本向量化服務,輸入文本最大長度300 token,輸出向量維度1536維。
OpenSearch通用文本向量化服務-002:提供多語言(100+)文本向量化服務,輸入文本最大長度8192 token,輸出向量維度1024維。
OpenSearch文本向量化服務-中文-001:提供中文文本向量化服務,輸入文本最大長度1024 token,輸出向量維度768維。
OpenSearch文本向量化服務-英文-001:提供英文文本向量化服務,輸入文本最大長度512 token,輸出向量維度768維。
GTE文本向量-多語言-Base:多語言(70+)文本向量化服務,輸入文本最大長度8192,輸出向量維度768維。
Qwen3文本向量-0.6B:Qwen3系列多語言(100+)文本向量化服務,輸入最大長度32k,輸出向量維度可自訂32~1024維,參數量0.6B。
多模態向量化
M2-Encoder-多模態向量模型:中英雙語多模態服務,基於60億圖文對資料(其中30億為中文資料,30億為英文資料)在BM-6B基礎上訓練而成。該模型支援圖文跨模態檢索(包括文本搜尋圖片和圖片搜尋文本),以及圖片分類任務。
M2-Encoder-Large-多模態向量模型:中英雙語多模態服務,相比M2-Encoder模型擁有更大的參數量,達到 1B(10億參數),從而在多模態任務處理中具備更強的表達能力和效能表現。
文本稀疏向量化
提供將文本資料轉化為稀疏向量形式表達的服務,稀疏向量儲存空間更小,常用於表達關鍵詞和詞頻資訊,可與稠密向量搭配進行混合檢索,提升檢索效果。
OpenSearch文本稀疏向量化服務:提供多語言(100+)文本向量化服務,輸入文本最大長度8192 token。
向量微調
向量微調embedding-tuning:提供向量模型調優服務,可通過定製訓練向量降維等模型,在不帶來過多檢索效果損失的情況下,輔助將高維度向量降低維度,以便提升性價比。
查詢分析
提供Query內容分析服務,基於大語言模型及NLP能力,可對使用者輸入的查詢內容進行意圖識別、相似問題擴充、NL2SQL處理等,有效提升RAG情境中檢索問答效果。
通用Query分析服務,基於大語言模型對使用者輸入Query進行意圖理解以及相似問題擴充。
排序服務
BGE重排模型:提供基於BGE模型的文檔打分服務,可根據Query與文檔內容的相關性,按分數由高到低對DOC進行排序,並輸出對應的打分結果。支援中英雙語,最大輸入token長度512(Query+Doc長度)。
OpenSearch自研重排模型:融合多行業資料集訓練,提供高水準的重排服務,可根據Query及DOC的語義相關性從高到低對Doc進行排序。支援中英雙語,最大輸入token長度512(Query+doc長度)。
Qwen3排序服務-0.6B:Qwen3系列文檔重排服務,支援100+語言,最大輸入token長度32k(Query+doc長度),參數量0.6B。
語音辨識
語音辨識服務001:提供語音轉文本能力,可將視頻或音頻中的語音內容快速轉化為結構化文本。該服務支援多種語言。
視頻截幀
視頻截幀服務001:提供視頻內容提取能力,可從視頻中捕獲主要畫面格畫面。結合多模態向量服務或圖片解析能力,實現跨模態檢索。
大模型
Qwen3-235B-A22B:新一代Qwen系列大型語言模型,基於廣泛的訓練,Qwen3在推理、指令跟隨、Agent能力和多語言支援方面取得了突破性進展,可支援100多種語言和方言,具備強大的多語言理解、推理和產生能力。
OpenSearch-通義千問-Turbo:以qwen-turbo大規模語言模型為模型底座,進行有監督的模型微調,強化檢索增強,減少有害性。
通義千問-Turbo:通義千問系列速度最快、成本極低的模型,適合簡單任務,詳情請參見通義千問Turbo。
通義千問-Plus:能力均衡,推理效果、成本和速度介於通義千問-Max和通義千問-Turbo之間,適合中等複雜任務,詳情請參見通義千問Plus。
通義千問-Max:通義千問系列效果最好的模型,適合複雜、多步驟的任務,詳情請參見通義千問Max。
QwQ深度思考模型:基於Qwen2.5-32B模型訓練的 QwQ 推理模型,通過強化學習大幅度提升了模型推理能力。
DeepSeek-R1:專註於複雜推理任務的大語言模型,在複雜指令理解、結果準確性等方面表現較突出。
DeepSeek-V3:MoE模型,在長文本、代碼、數學、百科、中文能力上表現優秀。
DeepSeek-R1-distill-qwen-7b:基於知識蒸餾技術,通過使用DeepSeek-R1產生的訓練樣本對Qwen-7B微調訓練的模型。
DeepSeek-R1-distill-qwen-14b:基於知識蒸餾技術,通過使用DeepSeek-R1產生的訓練樣本對Qwen-14B微調訓練的模型。
連網搜尋
搜尋過程中,當私人知識庫無法給出相應的答案時,可拓展連網搜尋,擷取更多互連網資訊,補充私人知識庫,結合大語言模型給出更豐富的回答。
選擇服務卡片左下角查看詳情,查看當前服務的服務名稱、服務ID、服務簡介以及收費方式。
選擇服務卡片右上方體驗,可跳轉至體驗中心,對服務進行測試和效果預覽,詳情請參見體驗中心。