阿里云PAI为您提供了基于不同框架、不同CUDA版本的官方镜像,您可以在使用DLC、EAS、DSW时直接选择适用的镜像,即可快速基于官方镜像构建AI开发环境。本文为您介绍PAI预置的官方镜像能力和核心镜像列表。
认识官方镜像
阿里云PAI为您提供的官方镜像遵循一定的命名规则,您可以通过镜像名称了解到此镜像的基本信息。通常镜像命名会包含以下几个固定字段,建议您添加自定义镜像时使用统一的命名规则。
官方镜像名称示例 | 镜像名称解读 | 各个产品支持使用的镜像类型 |
|
| 官方镜像适用的子产品不同:
|
|
|
官方镜像能力
阿里云PAI为您提供了基于不同机器学习框架的官方镜像,您可以在PAI控制台的镜像AI资产页面中查看所有官方镜像列表,以下为您介绍基于TensorFlow、PyTorch等主流框架的官方镜像信息。
Python
简介
Python 是一种简单易用、功能强大的高级编程语言,在机器学习中主要用于数据处理、模型开发和训练,它拥有丰富的库(如 NumPy、PyTorch、TensorFlow 等)和极高的开发效率。阿里云PAI提供两种类型的 Python镜像。
主要特性
支持 Ubuntu 22.04 和 Ubuntu 24.04 两个版本的 Ubuntu镜像。
支持阿里云的高性能网络RDMA。
支持不同版本的Python,涵盖 3.10 到 3.14。
支持不同版本的CUDA,涵盖 12.4 到 13.0。
内置常用开发工具如curl、git、wget、rclone、ping等。
pip和apt使用阿里云镜像源。
PyTorch
简介
阿里云PAI平台提供两种类型的PyTorch镜像。
基于阿里云PAI提供的 Python 镜像构建,在 Python镜像的基础上新增了PyTorch、TorchVision、TorchAudio 软件包,涵盖了Python镜像的所有特性,覆盖了2.4.0以上的pytorch官方发布的版本。
基于NGC提供的PyTorch镜像构建, 内置了常用开发工具,pip和apt使用阿里云镜像源。
标签说明
-accl:
预装 ACCL:阿里云高性能集合通信库的镜像,在NCCL的基础上可以为客户提供更高的通信性能。
基于ACCL版本的镜像进行开发训练时需使用预置的Python环境。如果需要使用Python虚拟环境,需要参考安装方法,在相应环境下配置ACCL库,才能使用ACCL的特性。
-ngc:
基于NGC的PyTorch镜像构建的镜像,标签中包含NGC镜像的版本信息,如
2.10.0-gpu-py312-cu130-ubuntu24.04-ngc25.11是基于NGC 25.11 版本的PyTorch镜像构建。关于NGC PyTorch镜像的特性可以参考 NVIDIA 官方文档。
TensorFlow
框架版本 | CUDA版本(仅GPU机型) | 操作系统 |
|
|
|
TensorFlowServing
框架版本 | CUDA版本(仅GPU机型) | 操作系统 |
|
|
|
DeepRec
框架版本 | CUDA版本(仅GPU机型) | 操作系统 |
| CUDA 11.4 | Ubuntu 18.04 |
XGBoost
框架版本 | CUDA版本(仅GPU机型) | 操作系统 |
XGBoost1.6.0 | 不涉及,仅支持CPU机型 | Ubuntu 18.04 |
TritonServer
框架版本 | CUDA版本(仅GPU机型) | 操作系统 |
|
| Ubuntu 20.04 |
核心镜像列表
灵骏智算资源(Serverless版)适用的镜像
镜像名称 | 框架 | 机型 | CUDA | 操作系统 | 地区 | 开发语言&版本 |
deepspeed-training:23.06-gpu-py310-cu121-ubuntu22.04 |
| GPU | 12.1 | ubuntu22.04 | 华北6(乌兰察布) | Python3.10 |
megatron-training:23.06-gpu-py310-cu121-ubuntu22.04 |
| GPU | 12.1 | ubuntu22.04 | 华北6(乌兰察布) | Python3.10 |
nemo-training:23.06-gpu-py310-cu121-ubuntu22.04 |
| GPU | 12.1 | ubuntu22.04 | 华北6(乌兰察布) | Python3.10 |
AIGC相关镜像
镜像名称 | 框架 | 机型 | CUDA | 操作系统 | 支持地区 | 开发语言&版本 |
stable-diffusion-webui:3.0 | StableDiffusionWebUI3.0 | GPU | 11.7 | ubuntu22.04 |
| Python3.10 |
stable-diffusion-webui:2.2 | StableDiffusionWebUI2.2 | GPU | 11.7 | ubuntu22.04 | Python3.10 | |
stable-diffusion-webui:1.1 | StableDiffusionWebUI1.1 | GPU | 11.7 | ubuntu22.04 | Python3.10 | |
stable-diffusion-webui-env:pytorch1.13-gpu-py310-cu117-ubuntu22.04 | SD-WebUI-ENV | GPU | 11.7 | ubuntu22.04 | Python3.10 |
EAS主推的镜像
阿里云PAI提供的EAS产品部分官方镜像列表如下所示。您可以前往PAI控制台的镜像AI资产页面查看更完整的镜像列表信息。以下列出的镜像地址以华东1(杭州)区域为例。
镜像名称 | 框架 | 镜像描述 | 镜像地址 |
chat-llm-webui:3.0-blade |
| 用于EAS推理镜像,使用Blade后端为大型语言模型(LLM)提供推理服务,该推理服务同时支持WebUI与API访问。 |
|
chatbot-langchain:1.0 | ChatbotLangChain 1.0 | 基于LangChain搭建的知识库问答,用于EAS推理镜像。 |
|
comfyui:0.2-api | ComfyUI 0.2 | 基于ComfyUI的EAS镜像,用于文生图、图生图等异步API调用。 |
|
comfyui:0.2 | ComfyUI 0.2 | 基于ComfyUI的EAS镜像,用于文生图、图生图等场景。 |
|
comfyui:0.2-cluster | ComfyUI 0.2 | 基于ComfyUI的EAS镜像,用于文生图、图生图等场景。 |
|
kohya_ss:2.2 | Kohya 2.2 | 基于Kohya的EAS镜像,用于部署Stable Diffusion模型微调应用。 |
|
modelscope-inference:1.9.1 | ModelScope 1.9.1 | 用于部署Modelscope模型。 |
|
stable-diffusion-webui:4.2-cluster-webui | StableDiffusionWebUI 4.2 | 基于Stable Diffusion WebUI的EAS镜像,用于文生图、图生图等场景,并且支持多用户同时访问和用户间资源隔离。 |
|
stable-diffusion-webui:4.2-api | StableDiffusionWebUI 4.2 | 基于Stable Diffusion WebUI的EAS镜像,用于文生图、图生图等异步API调用。 |
|
stable-diffusion-webui:4.2-standard | StableDiffusionWebUI 4.2 | 基于Stable Diffusion WebUI的EAS镜像,用于文生图、图生图等场景。 |
|
tensorflow-serving:2.14.1 | TensorflowServing 2.14.1 | 基于开源TensorFlow Serving镜像的EAS镜像,用于将TensorFlow模型部署为推理服务,仅适用于CPU环境。 |
|
tensorflow-serving:2.14.1-gpu | TensorflowServing 2.14.1 | 基于开源TensorFlow Serving镜像的EAS镜像,用于将TensorFlow模型部署为推理服务,适用于GPU环境。 |
|
chat-llm-webui:3.0 |
| 用于EAS推理镜像,使用HuggingFace后端为大型语言模型(LLM)提供推理服务,该推理服务同时支持WebUI与API访问。 |
|
chat-llm-webui:3.0-vllm |
| 用于EAS推理镜像,使用VLLM后端为大型语言模型(LLM)提供推理服务,该推理服务同时支持WebUI与API访问。 |
|
huggingface-inference:1.0-transformers4.33 | Transformers 4.33 | 用于部署HuggingFace模型。 |
|
tritonserver:23.11-py3 | TritonServer 23.11 | 基于开源TritonServer镜像的EAS镜像,用于将模型部署为推理服务。 |
|