Información general
La solución de pila completa de Alibaba Cloud para la IA generativa (GenAI) brinda servicios de proceso completo para los modelos fundacionales (FM) y otras tareas de desarrollo de IA. Esta solución ayuda a crear y optimizar modelos fundacionales, ajustarlos según las preferencias empresariales y desplegarlos de manera sencilla como servicios en línea, todo dentro de una infraestructura de IA personalizada y optimizada para el rendimiento y la eficiencia. Esta solución, sin importar la escala o la etapa de la empresa, permite ofrecer experiencias de cliente nuevas e inteligentes e impulsar la transformación empresarial con innovaciones en la IA generativa.
• Aceleración unificada de hardware y software para la IA
1. GPU para el entrenamiento y la inferencia de los modelos
Entrenamiento de modelos: La serie gn7 de las instancias ECS potencia las tareas de entrenamiento a gran escala con GPU de alto rendimiento
Inferencia de modelos: La serie gn6 de las instancias ECS ofrecen una opción rentable para las tareas de inferencia de modelos
2. Aceleración de IA
Puede utilizar GPU Accelerator AIACC para acelerar en hasta un 70 % las tareas de entrenamiento de IA y en dos o tres veces las tareas de inferencia, según el estándar de aprendizaje profundo Stanford DAWN.
Preparación de los datos
Prepare los datos para el entrenamiento de modelos con servicios inteligentes, personalizables y altamente eficientes para el etiquetado de datos multimodales.
Desarrollo del modelo
Construya modelos fundacionales con PAI-Designer, nuestra herramienta integral de modelado visualizado, o realice un desarrollo interactivo con el cuaderno en PAI-DSW.
Entrenamiento de modelos
Entrene modelos con PAI-DLC, nuestra plataforma integral para el aprendizaje profundo nativo en la nube y el entrenamiento que es compatible con los esquemas de algoritmos predefinidos y personalizados.
Despliegue del modelo
Despliegue el modelo como un servicio en línea o como una aplicación web con PAI-EAS, el cual es compatible con el despliegue con un solo clic de modelos complejos a gran escala
Tongyi Qianwen (Qwen)
Alibaba Cloud ofrece una serie de modelos de código abierto Tongyi Qianwen: Qwen-Max y Qwen-Plus, los modelos estrella de LLM; Qwen-Omni, Qwen-VL y Qwen-Audio, los modelos multimodales; QVQ y QwQ, los modelos de razonamiento; Qwen-Coder y Qwen-Math, los modelos verticales, entre otros. Los modelos Qwen cuentan con un entrenamiento previo en datos multilingües que cubren varios sectores y dominios. Ofrecen una gran variedad de capacidades, como la comprensión y la generación multimodal, procesamiento de imágenes de vanguardia y API completamente administradas para respaldar la innovación en la IA generativa. La última versión de Qwen3 adopta los exclusivos "modos de pensamiento dual", que permiten alternar de forma flexible entre los modos "Pensante" (para razonamientos profundos) y "No pensante" (para respuestas rápidas), con el fin de equilibrar la profundidad y la velocidad de inferencia al tiempo que se ahorran costes. Es ligero pero potente, superando a modelos de tamaño similar en precisión y versatilidad, y rompe las barreras del idioma con capacidades multilingües en 119 lenguas y dialectos.
Puede afinar fácilmente los modelos Qwen con los datos de su empresa y desplegarlos como servicios en línea que entienden su negocio.
Wan2.1
Wan2.1 es un conjunto de modelos de base de vídeo versátil y de código abierto para la generación de texto a vídeo e imagen a vídeo. Destaca en la generación de ilustraciones realistas gracias al manejo preciso de movimientos complejos, la mejora de la calidad de píxeles, el cumplimiento de los principios físicos y la optimización de la precisión en la ejecución de instrucciones.
DeepSeek
DeepSeek-V3 es un LLM de alto rendimiento que cuenta con una arquitectura de mezcla de expertos (MoE). DeepSeek-R1 está entrenado según DeepSeek-V3-Base. La Galería de modelos de PAI ofrece opciones de implementación acelerada, como BladeLLM, SGlang y vLLM, para que pueda implementar modelos de DeepSeek con un solo clic.
Llama 3
LLaMA 3 es un potente LLM de código abierto con un gran conjunto de datos de entrenamiento. Se centra en la innovación, la escalabilidad y la simplicidad con varias mejoras arquitectónicas sobre su predecesor, LLaMA 2. Puede acceder, ajustar e implementar LLaMA 3 con la Plataforma para IA (PAI) en unos pocos pasos simples.

Flujos de trabajo de inferencia y evaluación de modelos incorporados
Acelera los flujos de trabajo de desarrollo de modelos con herramientas integrales diseñadas para admitir SFT y LoRA, compresión de modelos incorporados y aceleración de inferencia, evaluación de modelos multidimensional en plantillas visualizadas e implementación de modelos con un solo clic

Configuración de la arquitectura RAG con un solo clic con AnalyticDB
Model Studio aplica conjuntamente la optimización de recuperación en profundidad con AnalyticDB, que proporciona capacidad de recuperación de más de 10 mil millones de vectores y es compatible con una variedad de productos de IA de Alibaba Cloud. Más información sobre RAG >

Medidas de seguridad integrales
Asegura los datos de su empresa en el almacenamiento y la transmisión completando el desarrollo de modelos y aplicaciones en su red dedicada de Virtual Private Cloud (VPC) y accediendo a los datos con PrivateLink, aplica una gobernanza de contenidos personalizable a los estímulos y al contenido, y combina principios responsables de IA con herramientas para la responsabilidad humana

Smart Studio
Smart Studio es una plataforma integral impulsada por GenAI que permite la creación de contenido diverso en un espacio de trabajo. Sus funciones preinstaladas y los flujos de trabajo predefinidos se adaptan a varios escenarios de la industria, lo que le permite crear contenido de imágenes y vídeos impresionantes sin esfuerzo.

Doc IA
Doc IA revoluciona la gestión de documentos digitales para las empresas gracias al poder de los LLM, incluidos los modelos Qwen. Analiza de forma eficiente varios documentos, extrae con precisión la información en función de los requisitos de la empresa y genera rápidamente documentos a medida.

Reconocimiento de voz automático
Esta solución ofrece funciones de alta precisión para convertir las voces de los archivos de audio y vídeo a texto en entornos complejos e identificar el inglés, el mandarín y el cantonés en contextos multilingües. Próximamente estará disponible en más idiomas.

Lingma
Lingma de Alibaba Cloud es un ayudante de codificación con la tecnología de los modelos Qwen. Ofrece características como la generación inteligente de código, un chat impulsado por la IA para desarrolladores, la modificación de código en múltiples archivos y funciones de ejecución automática de código.