藉助ACK雲原生AI套件,您可以在Kubernetes叢集中簡便、高效地運行AI任務。首先,利用Arena命令列工具和AI負載調度等基礎能力,您可以進行模型訓練、測試和分析效能。然後,通過彈性資料集加速和GPU異構資源管理,您可以部署模型推理服務。本文介紹使用雲原生AI套件運行典型任務的相關資訊。
雲原生AI套件支援的AI任務類型及描述如下。
AI任務類型 | 描述 | 參考文檔 |
模型訓練 | 您可以通過Arena提交各種類型的訓練任務,包括單機訓練、分布式訓練和彈性訓練。 | |
模型管理 | 您可以關聯和管理訓練任務及其產出的模型。 | |
模型分析最佳化 | 在模型正式部署前,您可以通過Arena提交模型效能分析和最佳化任務,確保模型達到上線標準。 |