本文介紹了AI搜尋開放平台的產品功能和對應的文檔動態。
2025年
06月
類別 | 功能名稱 | 功能描述 | 發布時間 | 相關文檔 |
新增 | 語音辨識 | AI搜尋開放平台支援通過API的方式調用語音辨識服務,可將視頻或音頻中的語音內容快速轉化為結構化文本,可用於會議記錄、視頻檢索、線上客服等情境。 | 2025-06-26 | |
新增 | 視頻截幀 | AI搜尋開放平台支援通過API的方式調用視頻截幀服務,可從視頻中提取主要畫面格畫面,並結合文字識別(OCR)、映像解析或多模態向量服務,實現對視頻內容的深度解析與結構化處理。 | 2025-06-26 | |
更新 | 文本向量化新增ops-qwen3-embedding-0.6b | Qwen3系列多語言(100+)文本向量化服務,輸入最大長度32k,輸出向量維度可自訂32~1024維,參數量0.6B | 2025-06-26 | |
更新 | 排序服務新增ops-qwen3-reranker-0.6b | Qwen3系列文檔重排服務,支援100+語言,最大輸入token長度32k(Query+doc長度),參數量0.6B。 | 2025-06-26 | |
更新 | 多模態向量服務新增ops-gme-qwen2-vl-2b-instruct | 基於 Qwen2-VL 多模態大型語言模型(MLLMs) 訓練的多模態向量服務,支援單一模態及多模態組合輸入,能夠高效處理文本、映像及組合類別型的資料。 | 2025-06-26 | |
新增 | 多模態向量 | 多模態向量(multi-modal-embedding) 基於Qwen2-VL多模態大型語言模型(MLLMs)訓練的多模態向量服務,支援單一模態及多模態組合輸入,能夠高效處理文本、映像及組合類別型的資料。 | 2025-06-4 |
04月
類別 | 功能名稱 | 功能描述 | 發布時間 | 相關文檔 |
更新 | 大模型服務新增Qwen3-235B-A22B | 新一代Qwen系列大型語言模型,基於廣泛的訓練,Qwen3在推理、指令跟隨、Agent能力和多語言支援方面取得了突破性進展,可支援100多種語言和方言,具備強大的多語言理解、推理和產生能力。 | 2025-04-29 |
03月
類別 | 功能名稱 | 功能描述 | 發布時間 | 相關文檔 |
新增 | 連網搜尋 | 上線連網搜尋功能,支援獨立調用連網搜尋API或在LLM回答過程中使用連網搜尋。 | 2025-03-20 | |
更新 | LLM模型新增QwQ深度思考模型 | 基於 Qwen2.5-32B 模型訓練的 QwQ 推理模型,通過強化學習大幅度提升了模型推理能力。模型數學代碼等核心指標(AIME 24/25、LiveCodeBench)以及部分通用指標(IFEval、LiveBench等)達到DeepSeek-R1 滿血版水平。 | 2025-03-20 | |
更新 | 模型部署 | 新增模型來源渠道:ModelScope 新增模型類型:多模態向量化模型、排序模型 | 2025-03-13 | |
新增 | 服務開發 | AI搜尋開放平台整合PAI DSW功能,開發人員可直接在平台內通過Notebook完成服務開發與執行。 | 2025-03-13 |
02月
類別 | 功能名稱 | 功能描述 | 發布時間 | 相關文檔 |
新增 | DeepSeek模型 | AI搜尋開放平台支援DeepSeek全系模型(含R1/V3及7B/14B蒸餾版本),提供OpenAI API相容調用能力。 | 2025-02-14 |
01月
類別 | 功能名稱 | 功能描述 | 發布時間 | 相關文檔 |
新增 | 模型部署 | AI搜尋開放平台中的模型獨立部署,提供更高並發、更低延遲的推理服務。 | 2025-01-07 |
2024年
10月
類別 | 功能名稱 | 功能描述 | 發布時間 | 相關文檔 |
新增 | 向量降維服務 | 支援結合使用者提供的向量資料,定製訓練向量降維模型。 | 2024-10-23 |
09月
類別 | 功能名稱 | 功能描述 | 發布時間 | 相關文檔 |
新增 | 增加rerank模型 | 增加自研rerank模型,融合多行業資料集訓練,支援多語言,在中文C-MTEB的8個檢索任務測評,超越開源bge-rerank系列模型。 | 2024-09-12 | |
新增 | 查詢分析服務增加NL2SQL | 查詢分析服務增加NL2SQL能力,支援NL2SQL服務配置及調用。 | 2024-09-12 | |
新增 | 增加多模態資料處理情境 | 情境中心新增多模態資料處理情境,支援文本、圖片解析及向量化。 | 2024-09-12 | |
新增 | RAG情境增加Llamaindex代碼架構 | 情境中心-基於RAG搭建知識庫線上問答,增加Llamaindex代碼架構。 | 2024-09-12 |
08月
類別 | 功能名稱 | 功能描述 | 發布時間 | 相關文檔 |
最佳化 | 圖片解析OCR最佳化 | 圖片解析OCR服務最佳化,效能提升40%左右。 | 2024-08 |
07月
類別 | 功能名稱 | 功能描述 | 發布時間 | 相關文檔 |
新增 | 評測管理 | 通過效果評測模組對RAG鏈路進行效果測評,上傳測評資料集後,可基於大模型輸出測評結果。 | 2024-07-08 | |
新增 | 體驗中心上傳資料 | 體驗中心支援上傳自有資料進行服務體驗。 | 2024-07-08 | |
新增 | 相容OpenAI SDK | AI搜尋開放平台與OpenAI進行介面相容,開發人員可通過OpenAI SDK調用AI搜尋開放平台提供的服務。 | 2024-07-08 | |
新增 | RAG情境增加Langchain代碼架構 | 情境中心-基於RAG搭建知識庫線上問答,增加Langchain代碼架構。 | 2024-07-08 | |
新增 | 查詢分析服務 | 提供Query內容分析服務,基於大語言模型及NLP能力,可對使用者輸入的查詢內容進行預先處理及相關識別,同時支援相似問題擴充,有效提升RAG情境中檢索問答效果。 | 2024-07-08 | |
新增 | 圖片解析服務 | 新增圖片內容解析服務,可基於多模態大模型對圖片內容進行解析理解以及文字識別,也可使用OCR能力進行圖片文字識別,解析後的文本可用於圖片檢索問答情境。 | 2024-07-08 | |
新增 | 查詢分析服務體驗 | 體驗中心增加查詢分析服務,可根據歷史訊息、Query給出意圖及相似問題。 | 2024-07-30 | |
新增 | RAG情境增加圖片解析能力 | RAG情境增加文檔中的圖片解析能力,同時補充查詢分析服務,可根據改寫後的Query進行後續問答。 | 2024-07-30 | |
新增 | 增加VPC訪問地區 | 支援上海、杭州、深圳、北京、青島、張家口地區使用VPC訪問服務。 | 2024-07-30 |
06月
類別 | 功能名稱 | 功能描述 | 發布時間 | 相關文檔 |
新增 | 基於RAG搭建知識庫線上問答 | 針對知識庫線上問答情境,AI搜尋開放平台提供完整的RAG開發鏈路搭建方法,整體鏈路包含資料預先處理、檢索服務以及問答總結產生三大模組。 | 2024-06-18 |
05月
類別 | 功能名稱 | 功能描述 | 發布時間 | 相關文檔 |
新增 | 大模型服務 | 新增大模型服務,包含通義千問,以及微調後的RAG專屬大模型。 | 2024-05-21 | |
新增 | 排序服務 | 新增排序服務,提供通用的文檔打分能力,可根據query與文檔內容的相關性,按分數由高到低對doc進行排序,並輸出對應的打分結果。 | 2024-05-21 | |
新增 | 文本稀疏向量服務 | 新增文本稀疏向量服務,支援將文本資料轉化為稀疏向量形式表達。 | 2024-05-21 | |
新增 | 文本向量服務 | 新增文本向量服務,支援將文本資料轉化為稠密向量形式表達。 | 2024-05-21 | |
新增 | 文檔切片服務 | 新增文檔切片服務,提供通用的文本切片策略,可基於文檔段落格式、文本語義、指定規則,對HTML、Markdown、txt格式的結構化資料進行拆分,同時支援富文本形式提取code、image、table。 | 2024-05-21 | |
新增 | 文檔解析服務 | 新增文檔解析服務,支援從非結構化文檔中提取出標題、分段等邏輯層級結構,以及文本、表格、圖片等資訊,並以結構化的格式輸出。 | 2024-05-21 | |
新增 | 服務體驗 | 新增控制台服務體驗能力,支援文本解析、切片、向量、排序、大模型等服務體驗。 | 2024-05-21 |