Es compatible con la computación heterogénea en cualquier caso.
Elastic GPU Service ofrece un sistema de servicio completo que combina software y hardware para ayudarle a asignar recursos de manera flexible, escalar de forma elástica su sistema, mejorar la capacidad computacional y reducir el costo de su negocio relacionado con la IA. Se puede utilizar en ámbitos como el aprendizaje profundo, la codificación y decodificación de video, el procesamiento de video, la computación científica, la visualización gráfica y los juegos en la nube.
Elastic GPU Service ofrece funciones de computación acelerada en la GPU y recursos informáticos de GPU escalables y listos para usar. Las GPU presentan beneficios únicos para llevar a cabo operaciones de computación matemática y geométrica, sobre todo en coma flotante y computación paralela. Además, ofrecen una capacidad computacional 100 veces superior a la de sus homólogas CPU.
Capacidades de computación variadas
Disponen de un gran número de unidades aritméticas lógicas (ALU) que pueden utilizarse para la computación paralela a gran escala. Elastic GPU Service utiliza los últimos chips de aceleración de GPU y facilita varias tarjetas aceleradoras (como FPGA, GPU y ASIC) con fines empresariales (como IA, gráficos, transcodificación y cifrado).
Facilidad de uso
Los recursos de GPU se implementan a escala mundial en diferentes ubicaciones geográficas. Las sencillas unidades de control lógico permiten escalar su sistema en función de las necesidades de su empresa. Elastic GPU Service también dispone de herramientas auxiliares, como AIACC, FastGPU y cGPU.
Alto rendimiento de red
Utiliza la arquitectura SHENLONG para mejorar el rendimiento del servidor y reducir la latencia de E/S. La GPU admite hasta 24 millones de PPS, un ancho de banda de hasta 64 Gbit/S a través de VPC. Es adecuado para escenarios de alto rendimiento donde múltiples hilos se ejecutan en paralelo para procesar tareas informáticas.
Software de GPU para mejorar la eficiencia computacional
Entrenamiento de AIACC
El entrenamiento de AIACC de Alibaba Cloud es un acelerador de IA optimizado para entornos de Alibaba Cloud. Puede mejorar en gran medida la eficiencia del aprendizaje distribuido de IA y el uso del ancho de banda de la red. El entrenamiento de AIACC ha batido dos récords mundiales:
El entrenamiento más rápido en la competición de DAWNBench ImageNet (organizada por la Universidad de Stanford)
El entrenamiento más económico en la competición de DAWNBench ImageNet (organizada por la Universidad de Stanford)
Más información >
Características
-
Compatible con los principales sistemasSistemas de entrenamiento distribuidos: TensorFlow, PyTorch, MXNet y Caffe
-
Mejoras de rendimiento de entre el 50 % y el 300 %Modelos de red con uso intensivo de ancho de banda
-
Comunicación de alto rendimiento para uno o varios servidores de varios GPUEs compatible con la compresión de gradiente FP16 y la compresión de precisión mixta
-
Extensiones API para MXNetEs compatible con el paralelismo de datos y el paralelismo de modelos de tipo InsightFace
-
Optimización profunda para redes RDMAComunicación de enlace híbrido (RDMA y VPC)
Funciona mejor con
Inferencia AIACC
La inferencia AIACC de Alibaba Cloud es un acelerador de IA optimizado para entornos de Alibaba Cloud. Puede mejorar en gran medida el uso de la GPU y el rendimiento de la inferencia. La inferencia AIACC ha batido dos récords mundiales:
La latencia de inferencia más baja en la competición de DAWNBench ImageNet (organizada por la Universidad de Stanford)
La inferencia más económica en la competición de DAWNBench ImageNet (organizada por la Universidad de Stanford)
Más información >
Características
-
Compatible con varios sistemasTensorflow, Pytorch, MXNet y otros sistemas de aprendizaje profundo pueden exportar modelos en el formato Open Neural Network Exchange (ONNX) para mejorar el rendimiento de la inferencia
-
Entre un 30 % y un 400 % más de rendimientoModelos de redes de alta carga computacional
-
Compatible con varias precisiones de modeloOptimización de modelos en FP32 y FP16
Funciona mejor con
Herramienta de implementación de clústeres de GPU
Alibaba Cloud FastGPU es un conjunto de herramientas de implementación rápida para clústeres de GPU que ayudan a instalar recursos informáticos de GPU en la nube con solo unos clics. FastGPU es muy sencillo de configurar y se puede utilizar en cualquier lugar con facilidad. Es una solución rentable, fácil de usar y que reduce el tiempo de instalación de los clústeres de GPU.
Más información >
Características
-
Implementación rápidaOperaciones de API para una implementación rápida de scripts de inferencia y entrenamiento fuera de línea en clústeres de GPU
-
Fácil gestiónOfrece una herramienta de línea de comandos para gestionar el estado y el ciclo de vida de los clústeres de GPU
-
Eficaz y rápidoNo es necesario llevar a cabo operaciones de implementación para computación, almacenamiento y red en la capa IAAS de Alibaba Cloud. El entorno adecuado se consigue de forma automática al obtener recursos del clúster.
Funciona mejor con
Software de uso compartido de GPU para contenedores
Permite que varios contenedores utilicen una única GPU dividiendo y asignando recursos de GPU a varios contenedores aislados. cGPU puede ejecutar varios contenedores en una única GPU y aislar las aplicaciones de GPU entre los contenedores. De esta manera, se mejora el uso de los recursos de hardware de la GPU.
Más información >
Características
-
División de la GPUDivide los recursos de la GPU para mejorar su uso
-
Uso compartido de GPUAhorro de costos al compartir la GPU entre varias aplicaciones de IA
-
FlexibilidadDivide con flexibilidad la capacidad computacional y la memoria de la GPU para cumplir con los requisitos de la aplicación
Funciona mejor con
Elastic GPU Service frente a servidores autogestionados acelerados por GPU
| Artículo | Elastic GPU Service | Servidor autogestionado acelerado por GPU |
|---|---|---|
|
|
· Le permite crear una o más instancias aceleradas por GPU con facilidad Cambios flexibles en la configuración de la instancia: Cuando la instancia ya no satisface sus necesidades, un simple reinicio es todo lo que se necesita para cambiar entre varias especificaciones dentro de la misma familia. · Proporciona anchos de banda ajustables |
· Requiere un periodo de suscripción ampliado · Tiene configuraciones que no se pueden cambiar · Requiere una compra única de ancho de banda de salida que no se puede ajustar |
|
|
· Incluye una consola web para la gestión en línea Incorpora un sistema operativo estándar (como un sistema operativo Windows original activado) y permite sustituir el sistema operativo en línea · Permite adquirir e instalar los controladores de la GPU al comprar la instancia |
· No dispone de herramientas de gestión en línea y requiere gestión y mantenimiento manuales・Necesita tener su propio sistema operativo, instalarlo y sustituirlo por su cuenta・Debe preparar e instalar los sistemas operativos de forma manual |
|
|
· Almacena tres copias de cada dato. Cuando una copia se daña, los datos pueden restaurarse con rapidez. · Los fallos de hardware pueden recuperarse de forma rápida y automática |
· Debe crear de forma manual un entorno de recuperación ante desastres y utilizar dispositivos de almacenamiento tradicionales de alto costo · Debe corregir de forma manual los datos dañados |
|
|
· Es compatible con los métodos de facturación de suscripción y pago por uso. Puede seleccionar un método de facturación acorde con las necesidades de su empresa · Permite adquirir recursos bajo demanda sin hacer una gran inversión inicial |
· Requiere adquirir recursos previo pago para cumplir las exigencias de configuración de las horas pico · Requiere una gran inversión inicial y supone un uso innecesario de recursos |
Casos
Solución líder del sector y alto rendimiento
Alibaba Cloud Elastic GPU Service ofrece soluciones líderes en el sector que pueden lograr un alto rendimiento, escalabilidad y fiabilidad a nivel empresarial en simulación y análisis de ingeniería. Gracias al gran tamaño de la memoria de la GPU y a su alto rendimiento, puede utilizar su capacidad computacional para ejecutar simulaciones complejas y resolver problemas difíciles.
Beneficios
-
Solución optimizadaUtiliza el modelado CFD para reducir el tiempo de resolución de forma significativa
-
Diseño electrónico acelerado de electromagnetismo computacionalAyudar a diseñar productos y componentes electrónicos de alto rendimiento mediante la simulación de un rendimiento electromagnético y la predicción de la radiación, las interferencias y la transmisión electromagnéticas
-
Simulación de ingenieríaAplicaciones virtualizadas en la nube que aumentan la productividad y reducen el presupuesto de TI
Funciona mejor con
Procesamiento de video en HD para una mejor visualización
Las tareas de procesamiento de video suelen plantear problemas, como grandes volúmenes de datos y un procesamiento prolongado. La GPU puede computar tareas en paralelo y puede utilizarse para optimizar el procesamiento de video. La GPU se utiliza principalmente en campos como la transcodificación de video de alta definición a gran escala, la transmisión en directo en 4K y 8K, las videoconferencias multiusuario y la reparación de fuentes de video.
Beneficios
-
Alto rendimientoOptimizaciones para mejorar el rendimiento computacional
-
Mayor capacidad computacionalEs compatible con el procesamiento rápido de datos de varios fotogramas y la capacidad computacional para procesar un gran número de tareas informáticas
Funciona mejor con
Computación de alto rendimiento
La GPU cumple una función esencial en la computación científica (como la predicción meteorológica, la exploración de hidrocarburos y la investigación de dinámica molecular), que requiere computación paralela a gran escala. Si se combina con la computación elástica, la GPU ofrece la capacidad computacional necesaria para llevar a cabo operaciones de coma flotante a gran escala. Dicha capacidad computacional está disponible en línea y fuera de línea.
Beneficios
-
Escalado automáticoSe integra con ESS y SLB para implementar el autoescalado
-
Mayor capacidad computacionalFacilita las últimas GPU y métodos de implementación rápida para cumplir los estrictos requisitos informáticos de la computación científica