全部產品
Search
文件中心

Hologres:AI模型與部署

更新時間:Feb 14, 2026

介紹 Hologres AI 節點內建模型的部署方式、使用說明及內建模型列表;調用內建模型須先購買 AI 資源,部署後可通過 AI Function 調用。

前提條件

調用 AI 節點的內建模型必須使用 AI 資源(GPU),因此需先購買 AI 資源。詳情請參見AI節點介紹與價格

模型部署

部署說明

  • 您可根據業務應用情境選擇合適的模型進行部署,每個模型須分配規定的最小 AI 資源方可部署。

  • 允許一個執行個體部署多個模型,但總資源不能超過所購買的 AI 總資源;若 AI 資源不足,請擴容。

  • 主從執行個體:僅支援在主執行個體部署模型及進行模型相關操作(更改資源、刪除模型等);從執行個體可查看主執行個體部署的模型,也可使用 AI Function 調用模型。

模型部署

  1. 登入Hologres管理主控台,在左上方選擇地區。

  2. 在左側導覽列單擊實例清單,然後單擊目標執行個體ID。

  3. 執行個體詳情頁面,單擊AI節點

  4. 模型列表地區,單擊部署模型

  5. 在部署模型對話方塊,填寫模型名稱並選擇模型類型資源配置的相關參數會根據已選擇模型類型進行填寫,每個模型的資源有建議最小值,可根據所選模型分配合理資源以發揮最佳效果。

  6. 配置完成後,單擊確認,進行模型部署。

    您可以在模型列表查看模型部署狀態並進行以下操作:

    • 調整模型配置:單擊目標模型操作列中的調整配置

    • 刪除模型:單擊目標模型操作列中的刪除

      說明

      刪除模型時不會校正正在調用的服務,請謹慎操作。

模型使用

模型部署成功後,可使用 Hologres 的 AI Function 進行調用。詳情請參見AI Function

模型列表

Hologres 內建一系列模型供 AI 情境使用。您可根據業務情境部署相關模型,部署完成後可用AI Function調用。Hologres 內建模型如下。

模型分類

模型名

單副本推薦部署的最小CPU規格(Core)

單副本推薦部署的最小記憶體規格(GB)

單副本推薦部署的最小卡數(張)

單副本推薦部署的最小GPU顯存(GB)

支援的執行個體版本

備忘

PDF轉換模型

ds4sd/docling-models

20

100

單卡/多卡

48 GB

Hologres V4.0 及以上版本

文本切分

recursive-character-text-splitter

15

30

0

0

Hologres V3.2 及以上版本

根據實際業務量選擇 CPU 規格,可以不需要設定 GPU 卡數

多模態模型

Qwen/Qwen2.5-VL-3B-Instruct

7

24

單卡/多卡

24 GB

Hologres V4.0 及以上版本

多模態模型

Qwen/Qwen2.5-VL-7B-Instruct

7

30

單卡/多卡

48 GB

Hologres V4.0 及以上版本

多模態模型

Qwen/Qwen2.5-VL-32B-Instruct

7

30

單卡/多卡

96 GB

Hologres V4.0 及以上版本

文本模型

clip-ViT-B-32-multilingual-v1

7

24

單卡

24 GB

Hologres V4.0 及以上版本

映像分塊 patch size:32×32;參數量:88M;返迴向量維度:512

文本產生

Qwen/Qwen3-1.7B

7

30

單卡/多卡

8 GB

Hologres V3.2 及以上版本

文本產生

Qwen/Qwen3-4B

7

30

單卡/多卡

16 GB

Hologres V3.2 及以上版本

文本產生

Qwen/Qwen3-8B

7

30

單卡/多卡

32 GB

Hologres V3.2 及以上版本

文本產生

Qwen/Qwen3-14B

7

30

單卡/多卡

48 GB

Hologres V3.2 及以上版本

文本產生

Qwen/Qwen3-32B

7

30

單卡/多卡

96 GB

Hologres V3.2 及以上版本

情感分類

iic/nlp_structbert_sentiment-classification_chinese-base

7

30

單卡

4 GB

Hologres V3.2 及以上版本

向量嵌入

iic/nlp_gte_sentence-embedding_chinese-base

7

30

單卡

12 GB

Hologres V3.2 及以上版本

輸出向量維度:768

向量嵌入

iic/nlp_gte_sentence-embedding_chinese-large

7

30

單卡

16 GB

Hologres V3.2 及以上版本

輸出向量維度:1024

向量嵌入

iic/nlp_gte_sentence-embedding_chinese-small

7

30

單卡

8 GB

Hologres V3.2 及以上版本

輸出向量維度:512

向量嵌入

Qwen/Qwen3-Embedding-0.6B

7

30

單卡

8 GB

Hologres V3.2 及以上版本

向量嵌入

Qwen/Qwen3-Embedding-4B

7

30

單卡

32 GB

Hologres V3.2 及以上版本

向量嵌入

Qwen/Qwen3-Embedding-8B

7

30

單卡

48 GB

Hologres V3.2 及以上版本

向量嵌入

BAAI/bge-base-en-v1.5

7

30

單卡

12 GB

Hologres V3.2 及以上版本

輸出向量維度:768

向量嵌入

BAAI/bge-base-zh-v1.5

7

30

單卡

12 GB

Hologres V3.2 及以上版本

輸出向量維度:768

向量嵌入

BAAI/bge-large-en-v1.5

7

30

單卡

16 GB

Hologres V3.2 及以上版本

輸出向量維度:1024

向量嵌入

BAAI/bge-large-zh-v1.5

7

30

單卡

16 GB

Hologres V3.2 及以上版本

輸出向量維度:1024

向量嵌入

BAAI/bge-small-en-v1.5

7

30

單卡

8 GB

Hologres V3.2 及以上版本

輸出向量維度:384

向量嵌入

BAAI/bge-small-zh-v1.5

7

30

單卡

8 GB

Hologres V3.2 及以上版本

輸出向量維度:512

文本模型

clip-ViT-B-32

7

24

單卡

24 GB

Hologres V4.0 及以上版本

映像分塊 patch size:32×32;參數量:88M;返迴向量維度:512

文本模型

clip-ViT-L-14

7

24

單卡

24 GB

Hologres V4.0 及以上版本

映像分塊 patch size:14×14;參數量:304M;返迴向量維度:768

向量嵌入

clip-ViT-B-16

7

24

單卡

24 GB

Hologres V4.0 及以上版本

映像分塊 patch size:16×16;參數量:88M;返迴向量維度:512