概要
データレイクは、大規模なデータワークロードに対応する最新のデータ分析アーキテクチャです。Alibaba Cloud の Data Lake Storage は、Object Storage Service (OSS) を基盤として構造化データ、半構造化データ、非構造化データの一元管理を実現し、IoT、ゲーム、オンライン教育、広告ビジネスに最適なソリューションを提供します。OSS は Hadoop、HIVE、Spark、Presto、Impala などの主要なビッグデータエコシステムとシームレスに連携します。
ソリューションの特長
-
データをそのまま格納
データ構造、スキーマ、サイズを問わず、複数のソースからデータレイクへデータを一元的に取り込み、格納できます。
-
堅牢な基盤
99.9999999999% (12 9s) の耐久性、99.995% の SLA を保証し、システム障害に対する強力なリモートディザスタリカバリを提供します。
-
高パフォーマンスなデータ処理
OSS Append Object 機能によりデータの並列アップロード・ダウンロードが可能です。新しいデータを追加しながらリアルタイムで読み取りでき、ワークロード分析の効率を向上させます。
-
スケーラブルで柔軟なアーキテクチャ
ストレージとコンピューティングリソースを分離するアーキテクチャにより、ビジネスニーズに応じてそれぞれのリソースを個別に調整でき、総所有コスト (TCO) を削減します。
Data Lake Storage の詳細を見る
営業に連絡Alibaba Cloud Data Lake Storage が支える教育・ゲーム・広告業界
お客様の課題
教育シナリオで必要な音声/動画、画像、システムログ、オンラインメッセージなどのデータが分散して保存されているため、データサイロが発生し、データ分析や運用保守のコストが増加します。
ソリューション
-
本ソリューションでは、OSS をさまざまな形式のデータの統合ストレージセンターとして活用します。世界中のオンライン教育データソースに簡単にアクセスし、画像、動画、音声、テキストファイルなどの教材をアップロードできます。EMR でコンピューティングクラスターを構築し、Spark、Hive、Presto などのビッグデータ処理サービスとシームレスに連携できます。さらに、教材に基づいてテスト結果を分析し、学生ごとの学習品質を評価して、インテリジェントなアルゴリズムによるカスタマイズされたガイダンスや的確なコンテンツレコメンデーションを提供できます。Alibaba Cloud CDN と組み合わせることで、世界中の学生にオンデマンドの教材を超低レイテンシで配信できます。
お客様の課題
ゲーム業界では、ゲームシナリオのタイムリーな調整に向けた効率的なデータ分析と、トラフィックピークやアップグレード要件に対応できるストレージとコンピューティング能力の高いスケーラビリティが求められます。
ソリューション
-
本ソリューションでは、EMR を使用して Hadoop や Hive などの各種データ処理プラットフォームやシステムのクラスターをデプロイし、さまざまなゲームシナリオのデータ分析要件に対応します。OSS を活用して、コールドデータをコスト効率の高いストレージにアーカイブし、ホットデータを高可用性のインスタンスに保存することで、リソース使用率とパフォーマンスを最適化できます。OSS と EMR の組み合わせアーキテクチャにより、Hadoop 分散ファイルシステム (HDFS) と同等の速度、信頼性、コスト効率を実現できます。ストレージとコンピューティングを分離したインスタンスは個別にスケーリングでき、システムパフォーマンスの調整や柔軟な拡張が可能です。管理と運用保守を簡素化しながら、アップグレードコストも削減できます。
お客様の課題
広告業界では、検索トラフィックやコンテンツ需要が絶えず変動するため、常駐コンピューティングクラスターによるパフォーマンス低下やリソースの無駄が発生します。
ソリューション
-
本ソリューションでは、ECS で構成された高い伸縮性を持つ Kubernetes クラスター上に、Hadoop、Hive、Presto などのデータ処理プラットフォームをデプロイします。イベントやプロモーション時のトラフィックピークにはスケールアップし、トラフィックが少ない時にはスケールダウンしてコストを削減できます。さまざまな形式のクエリデータは OSS に保存されます。コールドデータは OSS アーカイブに格納し、定期的にアクセスされるデータは高可用性を確保するため OSS 標準ストレージに保存します。設定可能なルールでデータの取得と管理を行い、ビジネスニーズに応じてストレージ容量をスケーリングし、ストレージコストを簡単に最適化できます。本ソリューションでは、Alibaba Cloud Elasticsearch でウェブサイトデータの高速インデックス作成と精密な検索を行い、Message Queue for Apache Kafka でウェブサイトのアクティビティの監視やリアルタイム統計の収集を行います。さらに、DLA でインタラクティブクエリを処理し、EMR Druid でリアルタイムクエリやアドホッククエリを実行します。これらのタスクはコンピューティングクラスター (Hadoop、Hive、Presto など) で処理され、結果は OSS 標準ストレージに保存されます。
Alibaba Cloud Elasticsearch
Kibana、商用機能、Alibaba Cloud VPC、Cloud Monitor、Resource Access Management などとの組み込み連携を備えたクラウドベースのサービスです。
詳細を見るData Lake Storage の詳細を見る
営業に連絡-
CSA STAR -
ISO 27001 -
SOC2 Type II Report -
C5 -
MLPS 2.0 -
MTCS

お問い合わせください。フォームにご記入いただければ、専任のビジネスアドバイザーが折り返しご連絡いたします。