すべてのプロダクト
Search
ドキュメントセンター

Dataphin:オフラインデータウェアハウス構築フロー

最終更新日:Feb 06, 2025

このチュートリアルでは、Dataphin を使用して基本的なオフラインデータウェアハウスを構築するための包括的なガイドを提供します。リソースの準備とデータウェアハウス計画の初期段階から、運用、メンテナンス、データバックフィル、および結果分析の後半段階までを網羅しています。このチュートリアルは、Dataphin オフラインデータウェアハウス構築プロセスを迅速かつ明確に理解できるようにすることを目的としています。

Dataphin を使用したオフラインデータウェアハウス構築の基本プロセスは、以下のとおりです。

主なプロセス

説明

操作ガイド

準備

まず、Alibaba Cloud アカウントの設定、Dataphin と MaxCompute の有効化と構成、データソースの準備など、必要なクラウドリソースを準備します。

手順 1:準備

データウェアハウス計画

計画フェーズは、データ構築の青写真として機能するため、非常に重要です。これには、データブロック、主題領域、コンピューティングソース、データソース、プロジェクトの作成、およびプロジェクトメンバーの追加が含まれます。

手順 2:データウェアハウス計画

データ統合

準備したデータソースをプロジェクトに組み込みます。

手順 3:データの導入

仕様定義

統計メトリック基準を定義し、Dataphin のデータ開発モジュールを使用して構成開発を完了します。これには、ビジネスオブジェクト、アクティビティ、アトミックメトリック、ビジネスフィルタ、および派生メトリックが含まれます。

手順 4:仕様定義

仕様モデリング

Dataphin の仕様モデリング機能を利用して、ソースデータをマッピングし、事前に定義された仕様に基づいてモデルを構築します。

手順 5:仕様モデリング

データ開発

仕様定義で概説されている統計メトリック基準と仕様モデリングで詳述されているモデルに従って、仕様モデリングデータの開発を進めます。これには、論理ディメンションテーブル、論理ファクトテーブル、アトミックメトリック、ビジネスフィルタ、および派生メトリックが含まれます。

  1. 手順 1:論理ディメンションテーブルの開発

  2. 手順 2:論理ファクトテーブルの開発

  3. 手順 3:アトミックメトリックの開発

  4. 手順 4:ビジネスフィルタの開発

  5. 手順 5:派生メトリックの開発

運用とメンテナンス データバックフィル

パイプラインタスク、論理ディメンションテーブル、論理ファクトテーブル、メトリックなどのタスクのデータを更新して、最新の状態に保ちます。

手順 7:運用とメンテナンス データバックフィル

データ検証

アドホッククエリを実行して、データの精度を確認します。

手順 8:データ検証