Es compatible con la computación heterogénea en cualquier caso.
Elastic GPU Service ofrece un sistema de servicio completo que combina software y hardware para ayudarle a asignar recursos de manera flexible, escalar de forma elástica su sistema, mejorar la capacidad computacional y reducir el costo de su negocio relacionado con la IA. Se puede utilizar en ámbitos como el aprendizaje profundo, la codificación y decodificación de video, el procesamiento de video, la computación científica, la visualización gráfica y los juegos en la nube.
Elastic GPU Service ofrece funciones de computación acelerada en la GPU y recursos informáticos de GPU escalables y listos para usar. Las GPU presentan beneficios únicos para llevar a cabo operaciones de computación matemática y geométrica, sobre todo en coma flotante y computación paralela. Además, ofrecen una capacidad computacional 100 veces superior a la de sus homólogas CPU.
Capacidades de computación variadas
Disponen de un gran número de unidades aritméticas lógicas (ALU) que pueden utilizarse para la computación paralela a gran escala. Elastic GPU Service utiliza los últimos chips de aceleración de GPU y facilita varias tarjetas aceleradoras (como FPGA, GPU y ASIC) con fines empresariales (como IA, gráficos, transcodificación y cifrado).
Facilidad de uso
Los recursos de GPU se implementan a escala mundial en diferentes ubicaciones geográficas. Las sencillas unidades de control lógico permiten escalar su sistema en función de las necesidades de su empresa. Elastic GPU Service también dispone de herramientas auxiliares, como AIACC, FastGPU y cGPU.
Alto rendimiento de red
Utiliza la arquitectura SHENLONG para mejorar el rendimiento del servidor y reducir la latencia de E/S. La GPU admite hasta 24 millones de PPS, un ancho de banda de hasta 64 Gbit/s a través de VPC y una red RDMA de 800 G. Es ideal para entornos de alto rendimiento en los que varios subprocesos se ejecutan en paralelo para procesar tareas informáticas.
Software de GPU para mejorar la eficiencia computacional
Entrenamiento de AIACC
El entrenamiento de AIACC de Alibaba Cloud es un acelerador de IA optimizado para entornos de Alibaba Cloud. Puede mejorar en gran medida la eficiencia del aprendizaje distribuido de IA y el uso del ancho de banda de la red. El entrenamiento de AIACC ha batido dos récords mundiales:
El entrenamiento más rápido en la competición de DAWNBench ImageNet (organizada por la Universidad de Stanford)
El entrenamiento más económico en la competición de DAWNBench ImageNet (organizada por la Universidad de Stanford)
Más información >
Características
-
Compatible con los principales sistemas
Sistemas de entrenamiento distribuidos: TensorFlow, PyTorch, MXNet y Caffe
-
Mejoras de rendimiento de entre el 50 % y el 300 %
Modelos de red con uso intensivo de ancho de banda
-
Comunicación de alto rendimiento para uno o varios servidores de varios GPU
Es compatible con la compresión de gradiente FP16 y la compresión de precisión mixta
-
Extensiones API para MXNet
Es compatible con el paralelismo de datos y el paralelismo de modelos de tipo InsightFace
-
Optimización profunda para redes RDMA
Comunicación de enlace híbrido (RDMA y VPC)
Funciona mejor con
Inferencia AIACC
La inferencia AIACC de Alibaba Cloud es un acelerador de IA optimizado para entornos de Alibaba Cloud. Puede mejorar en gran medida el uso de la GPU y el rendimiento de la inferencia. La inferencia AIACC ha batido dos récords mundiales:
La latencia de inferencia más baja en la competición de DAWNBench ImageNet (organizada por la Universidad de Stanford)
La inferencia más económica en la competición de DAWNBench ImageNet (organizada por la Universidad de Stanford)
Más información >
Características
-
Compatible con varios sistemas
Tensorflow, Pytorch, MXNet y otros sistemas de aprendizaje profundo pueden exportar modelos en el formato Open Neural Network Exchange (ONNX) para mejorar el rendimiento de la inferencia
-
Entre un 30 % y un 400 % más de rendimiento
Modelos de redes de alta carga computacional
-
Compatible con varias precisiones de modelo
Optimización de modelos en FP32 y FP16
Funciona mejor con
Herramienta de implementación de clústeres de GPU
Alibaba Cloud FastGPU es un conjunto de herramientas de implementación rápida para clústeres de GPU que ayudan a instalar recursos informáticos de GPU en la nube con solo unos clics. FastGPU es muy sencillo de configurar y se puede utilizar en cualquier lugar con facilidad. Es una solución rentable, fácil de usar y que reduce el tiempo de instalación de los clústeres de GPU.
Más información >
Características
-
Implementación rápida
Operaciones de API para una implementación rápida de scripts de inferencia y entrenamiento fuera de línea en clústeres de GPU
-
Fácil gestión
Ofrece una herramienta de línea de comandos para gestionar el estado y el ciclo de vida de los clústeres de GPU
-
Eficaz y rápido
No es necesario llevar a cabo operaciones de implementación para computación, almacenamiento y red en la capa IAAS de Alibaba Cloud. El entorno adecuado se consigue de forma automática al obtener recursos del clúster.
Funciona mejor con
Software de uso compartido de GPU para contenedores
Permite que varios contenedores utilicen una única GPU dividiendo y asignando recursos de GPU a varios contenedores aislados. cGPU puede ejecutar varios contenedores en una única GPU y aislar las aplicaciones de GPU entre los contenedores. De esta manera, se mejora el uso de los recursos de hardware de la GPU.
Más información >
Características
-
División de la GPU
Divide los recursos de la GPU para mejorar su uso
-
Uso compartido de GPU
Ahorro de costos al compartir la GPU entre varias aplicaciones de IA
-
Flexibilidad
Divide con flexibilidad la capacidad computacional y la memoria de la GPU para cumplir con los requisitos de la aplicación
Funciona mejor con
Elastic GPU Service frente a servidores autogestionados acelerados por GPU
Artículo | Elastic GPU Service | Servidor autogestionado acelerado por GPU |
---|---|---|
|
· Permite crear una o varias instancias aceleradas en la GPU con facilidad Admite cambios en línea entre tipos de instancia con diferentes números de vCPU y tamaños de memoria, incluidas las ampliaciones y reducciones de tipos de instancia · Ofrece anchos de banda ajustables |
· Requiere un periodo de suscripción ampliado · Tiene configuraciones que no se pueden cambiar · Requiere una compra única de ancho de banda de salida que no se puede ajustar |
|
· Incluye una consola web para la gestión en línea Incorpora un sistema operativo estándar (como un sistema operativo Windows original activado) y permite sustituir el sistema operativo en línea · Permite adquirir e instalar los controladores de la GPU al comprar la instancia |
· No dispone de herramientas de gestión en línea y requiere gestión y mantenimiento manuales・Necesita tener su propio sistema operativo, instalarlo y sustituirlo por su cuenta・Debe preparar e instalar los sistemas operativos de forma manual |
|
· Almacena tres copias de cada dato. Cuando una copia se daña, los datos pueden restaurarse con rapidez. · Los fallos de hardware pueden recuperarse de forma rápida y automática |
· Debe crear de forma manual un entorno de recuperación ante desastres y utilizar dispositivos de almacenamiento tradicionales de alto costo · Debe corregir de forma manual los datos dañados |
|
· Es compatible con los métodos de facturación de suscripción y pago por uso. Puede seleccionar un método de facturación acorde con las necesidades de su empresa · Permite adquirir recursos bajo demanda sin hacer una gran inversión inicial |
· Requiere adquirir recursos previo pago para cumplir las exigencias de configuración de las horas pico · Requiere una gran inversión inicial y supone un uso innecesario de recursos |
Casos
Solución líder del sector y alto rendimiento
Alibaba Cloud Elastic GPU Service ofrece soluciones líderes en el sector que pueden lograr un alto rendimiento, escalabilidad y fiabilidad a nivel empresarial en simulación y análisis de ingeniería. Gracias al gran tamaño de la memoria de la GPU y a su alto rendimiento, puede utilizar su capacidad computacional para ejecutar simulaciones complejas y resolver problemas difíciles.
Beneficios
-
Solución optimizada
Utiliza el modelado CFD para reducir el tiempo de resolución de forma significativa
-
Diseño electrónico acelerado de electromagnetismo computacional
Ayudar a diseñar productos y componentes electrónicos de alto rendimiento mediante la simulación de un rendimiento electromagnético y la predicción de la radiación, las interferencias y la transmisión electromagnéticas
-
Simulación de ingeniería
Aplicaciones virtualizadas en la nube que aumentan la productividad y reducen el presupuesto de TI
Funciona mejor con
Procesamiento de video en HD para una mejor visualización
Las tareas de procesamiento de video suelen plantear problemas, como grandes volúmenes de datos y un procesamiento prolongado. La GPU puede computar tareas en paralelo y puede utilizarse para optimizar el procesamiento de video. La GPU se utiliza principalmente en campos como la transcodificación de video de alta definición a gran escala, la transmisión en directo en 4K y 8K, las videoconferencias multiusuario y la reparación de fuentes de video.
Beneficios
-
Alto rendimiento
Optimizaciones para mejorar el rendimiento computacional
-
Mayor capacidad computacional
Es compatible con el procesamiento rápido de datos de varios fotogramas y la capacidad computacional para procesar un gran número de tareas informáticas
Funciona mejor con
Computación de alto rendimiento
La GPU cumple una función esencial en la computación científica (como la predicción meteorológica, la exploración de hidrocarburos y la investigación de dinámica molecular), que requiere computación paralela a gran escala. Si se combina con la computación elástica, la GPU ofrece la capacidad computacional necesaria para llevar a cabo operaciones de coma flotante a gran escala. Dicha capacidad computacional está disponible en línea y fuera de línea.
Beneficios
-
Escalado automático
Se integra con ESS y SLB para implementar el autoescalado
-
Mayor capacidad computacional
Facilita las últimas GPU y métodos de implementación rápida para cumplir los estrictos requisitos informáticos de la computación científica