Descripción general
Data Lake es una estructura de análisis de datos en tendencia compatible con las cargas de trabajo masivas de datos. Data Lake Storage de Alibaba Cloud utiliza Object Storage Service (OSS) como una base poderosa para ofrecer un almacenamiento central de datos estructurados, semiestructurados y no estructurados, por lo que es una solución ideal para IoT, los videojuegos, la educación en línea y las empresas publicitarias. OSS funciona fluidamente con los ecosistemas de datos masivos convencionales, como Hadoop, HIVE, Spark, Presto e Impala.
Puntos destacados de la solución
-
Almacenamiento de datos “tal como está”
Ingerir y almacenar datos de manera central y desde distintas fuentes tales como están al lago de datos, sin importar las estructuras, lo esquemas y el tamaño de los datos
-
Fundación sólida
Una disponibilidad del 99,999999999999 % (doce nueves), un SLA del 99,995 % y una recuperación ante desastres poderosa y remota en caso de fallos en el sistema.
-
Procesamiento de datos de alto rendimiento
Cargar y descargar datos en paralelo con la funcionalidad “añadir objeto” de OSS, la cual permite una lectura en tiempo real al mismo tiempo que se agregan datos nuevos y se mejora la eficiencia del análisis de la carga de trabajo
-
Arquitectura escalable y elástica
Ajustar los recursos de almacenamiento y de computación por separado según las necesidades empresariales basadas en la arquitectura que desacopla los recursos de almacenamientos y de computación con un costo total de propiedad (Total Cost of Ownership, TCO) más bajo.
Más información sobre Data Lake Storage
Contactar con VentasData Lake Storage de Alibaba Cloud y su apoyo a la educación, los videojuegos y la publicidad

Los desafíos
Los datos necesarios en las situaciones de educación, como el audio, el video, las imágenes, los registros y los mensajes en línea, se almacenan por separado, lo que provoca un efecto de isla de datos aislada y un aumento en los costos de análisis y O&M.
Nuestra solución
-
Esta solución utiliza OSS como el centro de almacenamiento unificado para los datos en formatos distintos, lo que ofrece un acceso sencillo a varias fuentes en línea de datos educativos y de manera global para cargar materiales educacionales, como imágenes, videos y archivos de audio y texto. Se pueden crear clústeres de computación con EMR para conectar, de manera fluida, con los servicios de procesamiento de datos masivos, como Spark, Hive y Presto. También se pueden analizar los resultados de las pruebas basadas en el software didáctico, evaluar la calidad de aprendizaje de cada estudiante y brindar una guía personalizada y recomendaciones de contenido precisas con algoritmos inteligentes. Esta solución se puede combinar con Alibaba Cloud CDN para ofrecer software didáctico bajo demanda para los estudiantes de todo el mundo y con una latencia ultra baja.
Object Storage Service
Un servicio de almacenamiento en la nube encriptado y seguro que puede almacenar, procesar y brindar acceso a grandes cantidades de datos
Más informaciónMessage Queue para Apache Kafka
Un servicio Apache Kafka totalmente administrado para construir rápidamente canalizaciones de datos para el análisis de datos masivos
Más información
Los desafíos
La industria de los videojuegos requiere un análisis de datos eficiente para ajustar las situaciones de manera oportuna y una alta escalabilidad del almacenamiento y de la potencia de computación para los picos de tráficos y los requisitos de actualización.
Nuestra solución
-
Esta solución utiliza EMR para ayudar a implementar clústeres con distintos tipos de plataformas y sistemas de datos, como Hadoop y Hive, para los requisitos de análisis de datos de las distintas situaciones de videojuegos. Puede utilizar OSS para archivar datos en frío en un almacenamiento más rentable y almacenar datos en caliente en instancia altamente disponibles para optimizar la utilización y el rendimiento de los recursos. La arquitectura que resulta de la combinación de OSS y EMR puede ofrecer una velocidad, una fiabilidad y una rentabilidad que cumplan con el sistema de archivos distribuido de Hadoop (Hadoop Distributed File System, HDFS). Las instancias de almacenamiento y de computación desacopladas se pueden escalar por separado para ajustarse al rendimiento del sistema y escalarse de manera flexible, lo que simplifica la administración y el O&M y disminuye los costos de actualización.
Object Storage Service
Un servicio de almacenamiento en la nube encriptado y seguro que puede almacenar, procesar y brindar acceso a grandes cantidades de datos
Más informaciónMessage Queue para Apache Kafka
Un servicio Apache Kafka totalmente administrado para construir rápidamente canalizaciones de datos para el análisis de datos masivos
Más informaciónDataWorks
Un entorno seguro para el desarrollo de datos fuera de línea, con potentes API de código abierto, con el que se puede crear un ecosistema para el re-desarrollo
Más información
Los desafíos
La industria publicitaria se enfrenta a cambios constantes en el tráfico de búsquedas y las demandas de contenido, lo que genera una disminución en el rendimiento o un desperdicio de recursos debido a los clústeres de computación residentes.
Nuestra solución
-
Esta solución implementa plataformas de procesamiento de datos, como Hadoop, Hive y Presto, con clústeres de Kubernetes altamente elásticos creados por ECS. Puede escalar hacia arriba en los picos de tráfico durante eventos y promociones, o hacia abajo cuando disminuya el tráfico para reducir los costos. Los datos de consulta se almacenan en OSS en distintos formatos; los datos en frío se archivan en el archivo de OSS y los datos de acceso regular se almacenan en el almacenamiento estándar de OSS para una alta disponibilidad. Puede buscar y administrar los datos con reglas configurables, escalar la capacidad de almacenamiento según las necesidades empresariales y optimizar fácilmente los costos de almacenamiento. Esta solución utiliza Elasticsearch de Alibaba Cloud para una indexación rápida y una búsqueda precisa de los datos del sitio web y Message Queue para Apache Kafka para monitorear las actividades del sitio web y recopilar las estadísticas en tiempo real. También utiliza DLA para procesar consultas interactivas y EMR Druid para las consultas en tiempo real y ad hoc. Estas tareas se procesan con los clústeres de computación (Hadoop, Hive, Presto, etc.) y los resultados se almacenan en un almacenamiento estándar de OSS.
Elastic Compute Service
Servidores en la nube virtual elásticos y seguros para satisfacer todas las necesidades de alojamiento en la nube
Más informaciónAlibaba Cloud Elasticsearch
Un servicio basado en la nube con servicios integrados como Kibana, características comerciales y la VPC, Cloud Monitor y Resource Access Management de Alibaba Cloud.
Más informaciónData Lake Analytics
Un servicio interactivo de análisis que permite utilizar una sintaxis SQL estándar y las herramientas de BI para analizar los datos almacenados en la nube de manera rentable.
Más informaciónMás información sobre Data Lake Storage
Contactar con VentasSeguridad y cumplimiento
-
CSA STAR
-
ISO 27001
-
SOC2 Type II Report
-
C5
-
MLPS 2.0
-
MTCS
Empiece a utilizar las soluciones de Alibaba Cloud
Descubra y experimente la potencia de Alibaba Cloud.
Contactar con Ventas