GPU虚拟化型实例的特点及规格 - GPU云服务器

GPU虚拟化型实例具有高性能图形处理和GPU加速计算能力，适用于图形加速/渲染场景或通用计算业务场景。本文为您介绍云服务器ECS GPU虚拟化型实例规格族的特点，并列出了具体的实例规格。

GPU虚拟化型实例规格族sgn8ia
GPU虚拟化型实例规格族sgn7i-vws（共享CPU）
GPU虚拟化型实例规格族vgn7i-vws
GPU虚拟化型实例规格族vgn6i-vws

GPU虚拟化型实例规格族sgn8ia

规格族介绍：
- 依托第三代神龙架构，提供稳定可预期的超高性能。同时通过芯片快速路径加速手段，完成存储、网络性能以及计算稳定性的数量级提升，可以更快地存储数据和加载模型。
- 已包含NVIDIA GRID vWS的软件License，可以为各类专业CAD软件提供认证过的图形加速能力，满足专业级图形设计的需求，也可以作为轻量级GPU计算型实例使用，降低小规模AI推理过程的使用成本。
适用场景：
- 配备高主频CPU、内存、GPU，可以处理更多并发AI推理任务，适用于图像识别、语音识别、行为识别业务。
- 支持RTX功能，搭配高主频CPU，提供高性能的3D图形虚拟化能力，适用于远程图形设计、云游戏等高强度图形处理业务。
- 使用高主频AMD Genoa处理器，主频最高可达3.75 GHz，在影视动漫制作、云游戏、机械设计等领域进行3D建模时，效果更加出色。
计算：
- 采用NVIDIA Lovelace架构GPU卡。
  - 更大的GPU显存，多种不同的GPU分片。
  - 支持vGPU、RTX、TensorRT等常用加速功能，提供多种业务支撑。
- 处理器：3.4 GHz~3.75 GHz的AMD Genoa高主频处理器，为3D建模配备更高算力。
存储：
- I/O优化实例。
- 支持NVMe协议。详情参见NVMe协议概述。
- 支持的云盘类型：ESSD云盘、ESSD AutoPL云盘和ESSD同城冗余云盘。更多云盘信息，请参见块存储概述。
网络：
- 支持IPv4、IPv6。关于IPv6通信，请参见IPv6通信。
- 实例网络性能与实例规格对应，规格越高网络性能越强。

sgn8ia包括的实例规格及指标数据如下表所示：

实例规格	vCPU	内存（GiB）	GPU显存	网络基础带宽（Gbit/s）	网络收发包PPS	多队列	弹性网卡	单网卡私有IPv4/IPv6地址数	最大支持云盘数量	云盘基础IOPS	云盘基准BPS（M）
ecs.sgn8ia-m2.xlarge	4	16	2 GB	2.5	100万	4	4	15/15	9	3万	244
ecs.sgn8ia-m4.2xlarge	8	32	4 GB	4	160万	8	4	15/15	9	4.5万	305
ecs.sgn8ia-m8.4xlarge	16	64	8 GB	7	200万	16	8	30/30	17	6万	427
ecs.sgn8ia-m16.8xlarge	32	128	16 GB	10	300万	32	8	30/30	33	8万	610
ecs.sgn8ia-m24.12xlarge	48	192	24 GB	16	450万	48	8	30/30	33	12万	1000
ecs.sgn8ia-m48.24xlarge	96	384	48 GB	32	900万	64	15	30/30	33	2.4万	2000

说明

上表中的GPU均为采用vGPU技术切分后的vGPU分片。
sgn8ia实例的内存和GPU显存均为实例独享，CPU为共享资源，超售比约为1:1.5。如对CPU算力有特殊要求，请购买直通GPU的独享型实例（例如GPU计算型实例gn7i等）。

GPU虚拟化型实例规格族sgn7i-vws（共享CPU）

规格族介绍：
- 依托第三代神龙架构，提供稳定可预期的超高性能。同时通过芯片快速路径加速手段，完成存储、网络性能以及计算稳定性的数量级提升，可以更快地存储数据和加载模型。
- 实例的CPU和网络资源采用共享模式提供，最大化利用底层资源。内存和GPU显存采用独享模式提供，为您提供数据隔离和性能保障。
  说明
  如果您需要独享的CPU资源，请选择vgn7i-vws。
- 已包含NVIDIA GRID vWS的软件License，可以为各类专业CAD软件提供认证过的图形加速驱动能力，满足专业级图形设计的需求，也可以作为轻量级GPU计算型实例使用，降低小规模AI推理过程的使用成本。
适用场景：
- 配备高性能CPU、内存、GPU，可以处理更多并发AI推理任务，适用于图像识别、语音识别、行为识别业务。
- 支持RTX功能，搭配高主频CPU，提供高性能的3D图形虚拟化能力，适用于远程图形设计、云游戏等高强度图形处理业务。
- 使用Ice Lake处理器，在影视动漫制作、云游戏、机械设计等领域进行3D建模时，效果更加出色。
计算：
- 采用NVIDIA A10 GPU卡。
  - 创新的Ampere架构。
  - 支持vGPU、RTX、TensorRT等常用加速功能，提供多种业务支撑。
- 处理器：2.9 GHz主频的Intel ^® Xeon ^® 可扩展处理器（Ice Lake），全核睿频3.5 GHz。
存储：
- I/O优化实例。
- 支持的云盘类型：ESSD云盘、ESSD AutoPL云盘和ESSD同城冗余云盘。更多云盘信息，请参见块存储概述。
网络：
- 支持IPv4、IPv6。关于IPv6通信，参见IPv6通信。
- 实例网络性能与实例规格对应，规格越高网络性能越强。

sgn7i-vws包括的实例规格及指标数据如下表所示：

实例规格	vCPU	内存（GiB）	GPU	GPU显存	网络带宽基础/突发（Gbit/s）	网络收发包PPS	多队列	弹性网卡	单网卡私有IPv4地址数	单网卡IPv6地址数
ecs.sgn7i-vws-m2.xlarge	4	15.5	NVIDIA A10 * 1/12	24GB * 1/12	1.5/5	50万	4	2	2	1
ecs.sgn7i-vws-m4.2xlarge	8	31	NVIDIA A10 * 1/6	24GB * 1/6	2.5/10	100万	4	4	6	1
ecs.sgn7i-vws-m8.4xlarge	16	62	NVIDIA A10 * 1/3	24GB * 1/3	5/20	200万	8	4	10	1
ecs.sgn7i-vws-m2s.xlarge	4	8	NVIDIA A10 * 1/12	24GB * 1/12	1.5/5	50万	4	2	2	1
ecs.sgn7i-vws-m4s.2xlarge	8	16	NVIDIA A10 * 1/6	24GB * 1/6	2.5/10	100万	4	4	6	1
ecs.sgn7i-vws-m8s.4xlarge	16	32	NVIDIA A10 * 1/3	24GB * 1/3	5/20	200万	8	4	10	1

说明

上表中的GPU列对应的指标包括GPU卡型号和GPU分片信息。其中，GPU分片表示1块GPU分成多片，每个实例上使用1片。例如：

NVIDIA A10 * 1/12中的NVIDIA A10表示GPU卡型号；1/12表示GPU分片，即1块GPU分成12片，每个实例上使用1片。

GPU虚拟化型实例规格族vgn7i-vws

规格族介绍：
- 依托第三代神龙架构，提供稳定可预期的超高性能。同时通过芯片快速路径加速手段，完成存储、网络性能以及计算稳定性的数量级提升，可以更快地存储数据和加载模型。
- 已包含NVIDIA GRID vWS的软件License，可以为各类专业CAD软件提供认证过的图形加速驱动能力，满足专业级图形设计的需求，也可以作为轻量级GPU计算型实例使用，降低小规模AI推理过程的使用成本。
适用场景：
- 配备高性能CPU、内存、GPU，可以处理更多并发AI推理任务，适用于图像识别、语音识别、行为识别业务。
- 支持RTX功能，搭配高主频CPU，提供高性能的3D图形虚拟化能力，适用于远程图形设计、云游戏等高强度图形处理业务。
- 使用Ice Lake处理器，在影视动漫制作、云游戏、机械设计等领域进行3D建模时，效果更加出色。
计算：
- 采用NVIDIA A10 GPU卡。
  - 创新的Ampere架构。
  - 支持vGPU、RTX、TensorRT等常用加速功能，提供多种业务支撑。
- 处理器：2.9 GHz主频的Intel ^® Xeon ^® 可扩展处理器（Ice Lake），全核睿频3.5 GHz。
存储：
- I/O优化实例。
- 支持的云盘类型：ESSD云盘、ESSD AutoPL云盘和ESSD同城冗余云盘。更多云盘信息，请参见块存储概述。
网络：
- 支持IPv4、IPv6。关于IPv6通信，参见IPv6通信。
- 实例网络性能与实例规格对应，规格越高网络性能越强。

vgn7i-vws包括的实例规格及指标数据如下表所示：

实例规格	vCPU	内存（GiB）	GPU	GPU显存	网络基础带宽（Gbit/s）	网络收发包PPS	多队列	弹性网卡	单网卡私有IPv4地址数	单网卡IPv6地址数
ecs.vgn7i-vws-m4.xlarge	4	30	NVIDIA A10 * 1/6	24GB * 1/6	3	100万	4	4	10	1
ecs.vgn7i-vws-m8.2xlarge	10	62	NVIDIA A10 * 1/3	24GB * 1/3	5	200万	8	6	10	1
ecs.vgn7i-vws-m12.3xlarge	14	93	NVIDIA A10 * 1/2	24GB * 1/2	8	300万	8	6	15	1
ecs.vgn7i-vws-m24.7xlarge	30	186	NVIDIA A10 * 1	24GB * 1	16	600万	12	8	30	1

说明

上表中的GPU列对应的指标包括GPU卡型号和GPU分片信息。其中，GPU分片表示1块GPU分成多片，每个实例上使用1片。例如：

NVIDIA A10 * 1/6中的NVIDIA A10表示GPU卡型号；1/6表示GPU的分片，即1块GPU分成6片，每个实例上使用1片。

GPU虚拟化型实例规格族vgn6i-vws

重要

由于GRID驱动的升级，阿里云对原vgn6i规格族进行了升级，新规格族为vgn6i-vws。新规格族采用最新的GRID驱动，并赠送了GRID vws授权。请提交工单申请已预装GRID驱动的免费镜像。
如果需要使用其他公共镜像或自定义镜像，由于这些镜像中未包含GRID驱动，请提交工单申请GRID驱动文件单独安装，阿里云不对GRID驱动额外收取License费用。

适用场景：
- 云游戏的云端实时渲染。
- AR和VR的云端实时渲染。
- AI（DL和ML）推理，适合弹性部署含有AI推理计算应用的互联网业务。
- 深度学习的教学练习环境。
- 深度学习的模型实验环境。
计算：
- 采用NVIDIA T4 GPU计算加速器。
- 实例包含分片虚拟化后的虚拟GPU。
  - 计算能力支持NVIDIA Tesla T4的1/4和1/2。
  - GPU显存支持4 GB和8 GB。
- 处理器与内存配比约为1:5。
- 处理器：2.5 GHz主频的Intel ^® Xeon ^® Platinum 8163（Skylake）。
存储：
- I/O优化实例。
- 支持的云盘类型：ESSD云盘、ESSD AutoPL云盘、ESSD同城冗余云盘、SSD云盘和高效云盘。更多云盘信息，请参见块存储概述。
网络：
- 支持IPv4、IPv6。关于IPv6通信，参见IPv6通信。
- 实例网络性能与实例规格对应，规格越高网络性能越强。

vgn6i-vws包括的实例规格及指标数据如下表所示：

实例规格	vCPU	内存（GiB）	GPU	GPU显存	网络基础带宽（Gbit/s）	网络收发包PPS	多队列	弹性网卡	单网卡私有IPv4地址数	单网卡IPv6地址数
ecs.vgn6i-m4-vws.xlarge	4	23	NVIDIA T4 * 1/4	16GB * 1/4	2	50万	4/2	3	10	1
ecs.vgn6i-m8-vws.2xlarge	10	46	NVIDIA T4 * 1/2	16GB * 1/2	4	80万	8/2	4	10	1
ecs.vgn6i-m16-vws.5xlarge	20	92	NVIDIA T4 * 1	16GB * 1	7.5	120万	6	4	10	1

说明

上表中的GPU列对应的指标包括GPU卡型号和GPU分片信息。其中，GPU分片表示1块GPU分成多片，每个实例上使用1片。例如：

NVIDIA T4 * 1/4中的NVIDIA T4表示GPU卡型号；1/4表示GPU的分片，即1块GPU分成4片，每个实例上使用1片。