Información general
El desarrollo de la tecnología de aprendizaje automático para los servicios de IA se basa en datos, algoritmos y potencia de cálculo. La solución de aceleración de la IA de Alibaba Cloud aprovecha los principales aceleradores de conjuntos de datos y de GPU para orquestar aplicaciones de uso intensivo de datos, optimizar la utilización de instancias de GPU y acelerar las tareas de inferencia y entrenamiento de modelos de IA. También puede utilizar la plataforma de entrenamiento de IA personalizable nativa de la nube de Alibaba Cloud, adaptarla a las necesidades de su negocio y mejorar la eficiencia de la infraestructura de IA y O&M diaria.
Descargar el documento técnicoPuntos destacados de la solución
-
Aceleración atómica rentable
Acelere el entrenamiento y las inferencias del modelo de IA con el acelerador de GPU más rápido, AIACC según la referencia de aprendizaje profundo Stanford DAWN, para acelerar los modelos de entrenamiento de IA en un 70%, las inferencias de 2 a 3 veces y reducir costes
-
Uso de GPU altamente eficiente
Mejore la tasa de utilización de todas las GPU en el clúster mediante la programación del clúster de GPU que comparte los recursos de la misma GPU y erradique la interferencia entre aplicaciones gracias al mecanismo de aislamiento de la GPU
-
Acelerador de conjuntos de datos reconocido por CNCF
Resuelva la alta latencia de acceso, el acceso paralelo complejo de múltiples fuentes de datos y el aislamiento débil de datos durante el entrenamiento de la IA con Fluid, el orquestador y acelerador de conjuntos de datos distribuido para aplicaciones de uso intensivo de datos
-
Plataforma de entrenamiento IA personalizable
Cree y personalice su plataforma de entrenamiento de la IA nativa de la nube con una consola de desarrollo y operación y mantenimiento (O&M), utilizando la suite IA nativa de la nube de Alibaba Cloud para mejorar la eficiencia de la ingeniería de IA en todas las etapas del aprendizaje profundo
¿Cómo funciona?
La solución de aceleración de la IA de Alibaba incluye la capa de la suite de IA nativa de la nube, la capa de programación de tareas de IA, la capa de aceleración de datos de IA, la capa del motor de aceleración de cálculos de IA, la capa de programación de recursos y la capa de recursos de cálculo Cada capa ofrece soluciones de aceleración específicas basadas en las características de la aplicación de IA en diferentes escenarios.
Suite de IA nativa de la nube: Simplifique las operaciones con servicios y componentes subyacentes, monitoree la utilización de recursos de GPU y recopile y analice registros de trabajos de IA. Puede utilizar líneas de comando para enviar tareas de IA y verificar el programa de entrenamiento del modelo.
Programación de tareas de IA: Programe tareas de IA para acelerar el entrenamiento de modelos, aumentar la utilización de la GPU y ahorrar costes.
AIACC: Aproveche los marcos de aprendizaje profundo como TensorFlow, PyTorch, MXNet y Caffe para categorizar imágenes y lograr el reconocimiento de imágenes, la predicción de la tasa de clics, la programación neuro-lingüística, el reconocimiento de voz, el reconocimiento facial, etc.
Aceleración de datos: Adopte una arquitectura con almacenamiento separado y recursos de computación con datos almacenados en diferentes dispositivos provenientes del entrenamiento de modelos local realizado en Alibaba Cloud. Los datos se almacenan en archivos pequeños y se calientan antes del entrenamiento del modelo para mejorar la transmisión y la eficiencia del entrenamiento.
Programación de recursos: Aumente la utilización de GPU y ahorre costes compartiendo recursos de GPU con múltiples tareas de IA y ejecutando tareas de IA individuales en múltiples GPU para el entrenamiento de modelos distribuidos
Recursos de computación - GPU: Administre y programe la memoria de la GPU y la potencia informática como contenedores con cGPU para acelerar el entrenamiento y la inferencia de la IA.
Alta utilización de GPU con cGPU
Maximice la eficiencia de utilización de la GPU y ahorre costes al gestionar y programar la memoria de la GPU y la potencia de cálculo como contenedores
Más informaciónCasos de uso
Reconocimiento de imágenes
Entrenamiento de distribución MXNet + SyncBN. El rendimiento aumentó en un 50%.
NLP
Entrenamiento en distribución del procesamiento de lenguaje natural. El rendimiento aumentó 6 veces.
Reconocimiento de voz
La voz se transforma en palabras. Texto enviado a los estudiantes y que se muestra en la pantalla cuando los estudiantes están hablando.
CTR (tasa de clics)
Entrenamiento en distribución. El rendimiento aumentó 6.6 veces.
Ofertas especiales
Elastic GPU Service
Potentes capacidades de cálculo paralelo basadas en tecnología de GPU

15% de descuento
• Aprendizaje profundo
• Procesamiento de vídeo
• Informática científica
File Storage NAS
Almacenamiento sencillo, confiable, escalable y bajo demanda conectado a la red para su uso con instancias de ECS, HPC y Container Service.

25% de descuento
• Pago por uso
• Sistemas de archivos NAS de capacidad
• Sistemas de archivos NAS de rendimiento
Container Registry
Plataforma de clase empresarial que proporciona una gestión segura y una distribución eficiente de imágenes de contenedores
• Edición avanzada ACR EE
• Seguridad de nivel empresarial
• Distribución global acelerada
Platform for AI
Plataforma de extremo a extremo para la extracción y el análisis de datos
• Interfaz visualizada
• Más de 100 componentes de algoritmo
• Potente capacidad de cálculo
Seguridad y cumplimiento
-
CSA STAR
-
ISO 27001
-
SOC2 Type II Report
-
C5
-
MLPS 2.0
-
MTCS
Recursos relacionados
Documento técnico
Documento técnico sobre la aceleración de la IA
Este documento técnico es una guía completa sobre el mecanismo de la capa de infraestructura de IA y su compatibilidad con la aceleración de la IA.
Más información >Práctica recomendada
cGPU (uso compartido de GPU) para la inferencia de IA
Este documento presenta el proceso de implementación del componente cGPU en el entorno ACK.
Más información >Práctica recomendada
Demostración de aceleración de la IA - AIACC + ACK (TensorFlow)
Esta demostración le ayuda a entrenar los datos de ImageNet con TensorFlow 2.4 aprovechando AIACC, un motor de aceleración de la IA que se ejecuta en ACK (K8s) para acelerar su entrenamiento de la IA.
Más información >Práctica recomendada
Demostración de aceleración de la IA - AIACC (TensorFlow)
Esta solución le ayuda a entrenar ImageNet con TensorFlow 2.4 aprovechando AIACC, un motor de aceleración de IA, para acelerar su entrenamiento de la IA.
Más información >Práctica recomendada
Demostración de aceleración de la IA - AIACC + ACK (PyTorch)
Esta solución le ayuda a entrenar los datos de ImageNet con PyTorch 1.9 aprovechando AIACC, un motor de aceleración de IA que se ejecuta en ACK (K8s), para acelerar su entrenamiento de la IA.
Más información >Curso en línea
Acelere las tareas de aprendizaje profundo con AIACC
Esta demostración muestra cómo se puede lograr entre 18 y 74% sin cambios en el código de TensorFlow existente y demuestra el poder de AIACC utilizando el conjunto de datos estándar de dígitos escritos a mano MNIST y muestras de radiografías de tórax de COVID-19.
Más información >Empiece a utilizar las soluciones de Alibaba Cloud
Descubra y experimente la potencia de Alibaba Cloud.
Contáctese con Ventas