Data Lake Storage

Alibaba Cloud Object Storage Service (OSS) で、99.9999999999% (12 9s) の可用性、99.995% の SLA、高いスケーラビリティを備えたデータレイクを構築。

概要

データレイクは、大規模なデータワークロードに対応する最新のデータ分析アーキテクチャです。Alibaba Cloud の Data Lake Storage は、Object Storage Service (OSS) を基盤として構造化データ、半構造化データ、非構造化データの一元管理を実現し、IoT、ゲーム、オンライン教育、広告ビジネスに最適なソリューションを提供します。OSS は Hadoop、HIVE、Spark、Presto、Impala などの主要なビッグデータエコシステムとシームレスに連携します。

ソリューションの特長

  • データをそのまま格納

    データ構造、スキーマ、サイズを問わず、複数のソースからデータレイクへデータを一元的に取り込み、格納できます。

  • 堅牢な基盤

    99.9999999999% (12 9s) の耐久性、99.995% の SLA を保証し、システム障害に対する強力なリモートディザスタリカバリを提供します。

  • 高パフォーマンスなデータ処理

    OSS Append Object 機能によりデータの並列アップロード・ダウンロードが可能です。新しいデータを追加しながらリアルタイムで読み取りでき、ワークロード分析の効率を向上させます。

  • スケーラブルで柔軟なアーキテクチャ

    ストレージとコンピューティングリソースを分離するアーキテクチャにより、ビジネスニーズに応じてそれぞれのリソースを個別に調整でき、総所有コスト (TCO) を削減します。

Data Lake Storage の詳細を見る

営業に連絡

Alibaba Cloud Data Lake Storage が支える教育・ゲーム・広告業界

お客様の課題

教育シナリオで必要な音声/動画、画像、システムログ、オンラインメッセージなどのデータが分散して保存されているため、データサイロが発生し、データ分析や運用保守のコストが増加します。

ソリューション

  • 本ソリューションでは、OSS をさまざまな形式のデータの統合ストレージセンターとして活用します。世界中のオンライン教育データソースに簡単にアクセスし、画像、動画、音声、テキストファイルなどの教材をアップロードできます。EMR でコンピューティングクラスターを構築し、Spark、Hive、Presto などのビッグデータ処理サービスとシームレスに連携できます。さらに、教材に基づいてテスト結果を分析し、学生ごとの学習品質を評価して、インテリジェントなアルゴリズムによるカスタマイズされたガイダンスや的確なコンテンツレコメンデーションを提供できます。Alibaba Cloud CDN と組み合わせることで、世界中の学生にオンデマンドの教材を超低レイテンシで配信できます。

Object Storage Service

暗号化対応のセキュアなクラウドストレージサービスで、大規模データの保存、処理、アクセスが可能です。

詳細を見る

Message Queue for Apache Kafka

フルマネージドの Apache Kafka サービスで、ビッグデータ分析向けのデータパイプラインを迅速に構築できます。

詳細を見る

お客様の課題

ゲーム業界では、ゲームシナリオのタイムリーな調整に向けた効率的なデータ分析と、トラフィックピークやアップグレード要件に対応できるストレージとコンピューティング能力の高いスケーラビリティが求められます。

ソリューション

  • 本ソリューションでは、EMR を使用して Hadoop や Hive などの各種データ処理プラットフォームやシステムのクラスターをデプロイし、さまざまなゲームシナリオのデータ分析要件に対応します。OSS を活用して、コールドデータをコスト効率の高いストレージにアーカイブし、ホットデータを高可用性のインスタンスに保存することで、リソース使用率とパフォーマンスを最適化できます。OSS と EMR の組み合わせアーキテクチャにより、Hadoop 分散ファイルシステム (HDFS) と同等の速度、信頼性、コスト効率を実現できます。ストレージとコンピューティングを分離したインスタンスは個別にスケーリングでき、システムパフォーマンスの調整や柔軟な拡張が可能です。管理と運用保守を簡素化しながら、アップグレードコストも削減できます。

Object Storage Service

暗号化対応のセキュアなクラウドストレージサービスで、大規模データの保存、処理、アクセスが可能です。

詳細を見る

Message Queue for Apache Kafka

フルマネージドの Apache Kafka サービスで、ビッグデータ分析向けのデータパイプラインを迅速に構築できます。

詳細を見る

DataWorks

強力な Open API を備えたセキュアなオフラインデータ開発環境で、再開発のためのエコシステムを構築できます。

詳細を見る

お客様の課題

広告業界では、検索トラフィックやコンテンツ需要が絶えず変動するため、常駐コンピューティングクラスターによるパフォーマンス低下やリソースの無駄が発生します。

ソリューション

  • 本ソリューションでは、ECS で構成された高い伸縮性を持つ Kubernetes クラスター上に、Hadoop、Hive、Presto などのデータ処理プラットフォームをデプロイします。イベントやプロモーション時のトラフィックピークにはスケールアップし、トラフィックが少ない時にはスケールダウンしてコストを削減できます。さまざまな形式のクエリデータは OSS に保存されます。コールドデータは OSS アーカイブに格納し、定期的にアクセスされるデータは高可用性を確保するため OSS 標準ストレージに保存します。設定可能なルールでデータの取得と管理を行い、ビジネスニーズに応じてストレージ容量をスケーリングし、ストレージコストを簡単に最適化できます。本ソリューションでは、Alibaba Cloud Elasticsearch でウェブサイトデータの高速インデックス作成と精密な検索を行い、Message Queue for Apache Kafka でウェブサイトのアクティビティの監視やリアルタイム統計の収集を行います。さらに、DLA でインタラクティブクエリを処理し、EMR Druid でリアルタイムクエリやアドホッククエリを実行します。これらのタスクはコンピューティングクラスター (Hadoop、Hive、Presto など) で処理され、結果は OSS 標準ストレージに保存されます。

Elastic Compute Service

柔軟かつセキュアな仮想クラウドサーバーで、あらゆる Cloud Hosting ニーズに対応します。

詳細を見る

Alibaba Cloud Elasticsearch

Kibana、商用機能、Alibaba Cloud VPC、Cloud Monitor、Resource Access Management などとの組み込み連携を備えたクラウドベースのサービスです。

詳細を見る

Data Lake Analytics

標準 SQL 構文と BI ツールを使用して、クラウドに保存されたデータを低コストで分析できるインタラクティブな分析サービスです。

詳細を見る

Data Lake Storage の詳細を見る

営業に連絡

セキュリティとコンプライアンス

世界の主要な法域にわたり、安定性、信頼性、セキュリティ、コンプライアンスに優れたクラウドインフラサービスを提供しています。
詳細を見る
  • CSA STAR
  • ISO 27001
  • SOC2 Type II Report
  • C5
  • MLPS 2.0
  • MTCS

Alibaba Cloud ソリューションを始める

Alibaba Cloud の実力を体験する。

営業に連絡