視覺理解模型 - Alibaba Cloud Model Studio

選擇適合映像分析、視頻理解、OCR等情境的模型。

映像與視頻理解

推薦從qwen3.6-plus開始，它是千問旗艦模型，支援1M上下文、最長2小時視頻、Function Calling和內建工具等完整功能。當您的情境穩定後，可以嘗試qwen3.6-flash來降低成本，它提供接近旗艦的效果，並支援相同的上下文長度和功能集。

映像解析度

大多數模型支援每張圖片最高1600萬像素。更高的解析度會消耗更多Token：每張圖片的Token數計算公式為 h x w / (32 x 32) + 2。

視頻支援

最長2小時 / 2GB：qwen3.6-plus、qwen3.6-flash、qwen3.5-plus、qwen3.5-flash
最長1小時 / 2GB：qwen3-vl-plus、qwen3-vl-flash
最長1小時 / 2GB：qwen3.5-omni-plus、qwen3.5-omni-flash（同時支援音頻輸入）

Function Calling與內建工具

讓模型根據映像或視頻中的內容執行操作。

Function Calling：Qwen3.6、Qwen3.5和Qwen3-VL系列模型均支援
內建工具（連網搜尋、代碼執行，無需額外配置）：僅qwen3.6-plus、qwen3.6-flash、qwen3.5-plus、qwen3.5-flash

結構化輸出

從視覺輸入中擷取有效JSON輸出，例如從照片中提取商品資訊。

Qwen3.6、Qwen3.5和Qwen3-VL系列在非思考模式下支援此功能。

OCR與文檔提取

qwen-vl-ocr專為文檔、表格、試卷和手寫內容的文字提取而最佳化。您也可以使用qwen3.6-plus或qwen3.6-flash進行通用圖片文字提取。

所有模型

Qwen3.6

模型ID	輸入	輸出	上下文	最大輸出	最大圖片數	最大視頻數	Function Calling	內建工具	結構化輸出
`qwen3.6-plus`	文本、映像、視頻	文本	1M	64k	256	64	支援	支援	支援
`qwen3.6-plus-2026-04-02`	文本、映像、視頻	文本	1M	64k	256	64	支援	支援	支援
`qwen3.6-flash`	文本、映像、視頻	文本	1M	64k	256	64	支援	支援	支援
`qwen3.6-flash-2026-04-16`	文本、映像、視頻	文本	1M	64k	256	64	支援	支援	支援
`qwen3.6-35b-a3b`	文本、映像、視頻	文本	256k	64k	256	64	支援	支援	支援

Qwen3.5

模型ID	輸入	輸出	上下文	最大輸出	最大圖片數	最大視頻數	Function Calling	內建工具	結構化輸出
`qwen3.5-plus`	文本、映像、視頻	文本	1M	64k	256	64	支援	支援	支援
`qwen3.5-plus-2026-02-15`	文本、映像、視頻	文本	1M	64k	256	64	支援	支援	支援
`qwen3.5-flash`	文本、映像、視頻	文本	1M	64k	256	64	支援	支援	支援
`qwen3.5-flash-2026-02-23`	文本、映像、視頻	文本	1M	64k	256	64	支援	支援	支援
`qwen3.5-397b-a17b`	文本、映像、視頻	文本	32k	8k	256	64	支援	支援	支援
`qwen3.5-122b-a10b`	文本、映像、視頻	文本	32k	8k	256	64	支援	支援	支援
`qwen3.5-27b`	文本、映像、視頻	文本	32k	8k	256	64	支援	支援	支援
`qwen3.5-35b-a3b`	文本、映像、視頻	文本	32k	8k	256	64	支援	支援	支援

舊版及其他模型

以下模型不再作為首選推薦。新專案提案使用Qwen3.6或Qwen3.5系列。如需查看模型詳細參數，請前往模型廣場。

華北2（北京） | 新加坡 | 美國 | 中國香港 | 法蘭克福

查看舊版及其他模型列表

Qwen3-VL

qwen3-vl-plus
qwen3-vl-plus-2026-01-25
qwen3-vl-flash
qwen3-vl-flash-2026-01-25

Qwen2.5-VL

qwen2.5-vl-72b-instruct
qwen2.5-vl-32b-instruct
qwen2.5-vl-7b-instruct
qwen2.5-vl-3b-instruct

Qwen-Omni

qwen3-omni-flash
qwen3-omni-flash-2025-10-22
qwen-omni-turbo及其快照版本

Qwen-OCR

qwen-vl-ocr
qwen-vl-ocr-latest
qwen-vl-ocr-2025-07-14

QVQ

qvq-max
qvq-max-2025-08-28
qvq-plus
qvq-plus-2025-08-27

舊版Qwen-VL

qwen-vl-max及其快照版本
qwen-vl-plus及其快照版本

Alibaba Cloud Model Studio：視覺理解模型