ACK Edge叢集的邊緣節點池支援管理線下GPU資源。本文介紹如何在ACK Edge叢集中的邊緣節點池中添加GPU節點。
前提條件
在接入節點前,需要先安裝好GPU驅動,驅動版本相關資訊請參見ACK支援的NVIDIA驅動版本列表。
使用限制
請確保您的叢集配額充足。如需添加更多節點,請到配額平台提交申請擴大配額。關於ACK Edge叢集的配額限制,請參見配額與限制。
添加GPU節點時會訪問部分網域名稱地址,需要節點側網路安全性群組放開限制允許訪問。具體資訊,請參見節點接入訪問網域名稱和IP路由網段配置。
操作步驟
1.26及以上版本叢集
ACK Edge叢集從1.26版本開始,接入Nvidia GPU時,無需配置gpuVersion參數直接接入,由接入工具自動檢查GPU型號並安裝相關組件。
添加GPU節點的操作與其他邊緣節點操作一致,具體操作,請參見添加邊緣節點。
1.26及以上版本的ACK Edge叢集支援全系列NVIDIA官方發布的生產級(Production Grade)GPU顯卡,包括Tesla系列、Hopper(H系列)、Ada Lovelace(A系列)以及L系列。
1.26以下版本叢集
在1.26以下版本ACK Edge叢集中添加GPU節點時,需要選擇以下支援的GPU型號。如果有其他GPU型號需求,請提交工單處理。
系統架構 | GPU型號 | 邊緣Kubernetes叢集版本 |
AMD64/x86_64 | Nvidia_Tesla_T4 | ≥1.16.9-aliyunedge.1 |
AMD64/x86_64 | Nvidia_Tesla_P4 | ≥1.16.9-aliyunedge.1 |
AMD64/x86_64 | Nvidia_Tesla_P100 | ≥1.16.9-aliyunedge.1 |
AMD64/x86_64 | Nvidia_Tesla_V100 | ≥1.18.8-aliyunedge.1 |
AMD64/x86_64 | Nvidia_Tesla_A10 | ≥1.20.11-aliyunedge.1 |
AMD64/x86_64 | Nvidia_L40 | ≥1.26.3-aliyun.1 |
登入Container Service管理主控台,在左側導覽列選擇叢集列表。
在叢集列表頁面,單擊目的地組群名稱,然後在左側導覽列,選擇。
在節點池頁面,選擇目標節點池右側操作列的
> 添加已有節點。進入添加節點頁面,單擊手動添加,添加現有執行個體。
單擊下一步進入執行個體資訊頁面,您可以在此處填寫節點接入配置,具體的配置參數,請參見參數列表。
說明產生節點接入指令碼時,需配置
gpuVersion參數。當前支援的GPU版本如下請參見使用限制。該參數配置完成後,接入工具會自動安裝nvidia-containerd-runtime,關於nvidia-containerd-runtime更多資訊,請參見nvidia-containerd-runtime。
配置完成後單擊下一步,進入添加完成頁面,單擊複製,到您的邊緣節點上粘貼並執行該指令碼。
添加節點成功的結果如下圖所示。
