データウェアハウスの計画は、Dataphin を使用してデータ中台を構築するための基礎となるステップであり、データアーキテクチャのトップレベル設計の重要な要素です。データ開発を開始する前に、データウェアハウス計画を確定することが不可欠です。これには、データブロック、プロジェクト、データソース、コンピュートソース、および統計期間の定義が含まれます。このトピックでは、このチュートリアル内でデータウェアハウスを計画するためのステップバイステップガイドを提供します。
背景情報
データブロック: データブロックは論理空間の主要な要素であり、ビジネス特性に基づいてセグメント化された名前空間として機能します。このチュートリアルでは、名前空間 [dataphin_tutorial] を例として使用します。
コンピュートソース: データ処理タスクに必要なコンピューティングおよびストレージリソースを提供します。
プロジェクト: Dataphin のプロジェクトは主要な組織単位として機能し、マルチユーザーの隔離とアクセスの制御のための境界を提供します。このチュートリアルでは、プロジェクト名 [dataphin_tutorial] を例として使用します。
データソース: このプロセスには、生のビジネスデータを読み取り、データウェアハウスに書き込むことが含まれます。
ステップ 1:データブロックを作成する
Dataphin ホームページの上部にあるメニューバーに移動し、[計画] > [データアーキテクチャ] を選択します。
[ビジネスユニット] ページで、[+ 新規データブロック] をクリックします。
[新規データブロック] ダイアログボックスで、[本番開発タイプ] ステップの [基本モード] を選択し、[次へ] をクリックします。
[ブロック定義] セクションで、ブロックの [基本情報] と [ビジネス情報] を入力します。
パラメーター
説明
[ブロック英語名]
dataphin_tutorial と入力します。
[ブロック名]
入門チュートリアル と入力します。
[説明] (オプション)
簡単な説明を入力します。たとえば、入門チュートリアル です。
[アイコン]
アイコンを選択します。[ブロックアーキテクト]
基本情報の更新、ビジネス情報の更新、ユニット管理など、ブロック情報設定の責任者を 1 人以上選択します。
[ビジネスオーナー] (オプション)
ブロックデータのビジネス利用の安定性に責任を負います。必要に応じて選択できます。
[リソースオーナー] (オプション)
ブロックデータの品質保証に責任を負います。必要に応じて選択できます。
[次へ] をクリックして、[論理テーブル命名規則] を構成します。新しい論理テーブルを作成するときに、命名規則に基づいて論理テーブル名が提案され、変更することができます。現在のデフォルト設定で十分です。
説明データブロックが確立されると、データブロック内で [R&D 仕様] > [テーブル仕様] > [論理テーブル命名規則] を変更できます。テーブルプレフィックスを変更すると、同じ論理テーブルカテゴリ内のすべてのサブタイプに影響します。たとえば、ディメンション論理テーブルカテゴリを変更すると、通常のディメンション論理テーブル、階層ディメンション論理テーブル、およびその他のサブタイプに影響します。
[確認] をクリックして、データブロックの作成を完了します。
データブロックの各パラメーターの構成の詳細については、「データブロックを作成する」をご参照ください。
ステップ 2:MaxCompute コンピュートソースを作成する
Dataphin ホームページの上部にあるメニューバーで、[計画] > [コンピュートソース] を選択します。
[コンピュートソース] ページで、[コンピュートソースを追加] をクリックし、[maxcompute コンピュートソース] を選択します。
[maxcompute コンピュートソースを作成] ページで、必須パラメーターを入力します。
パラメーター
説明
[コンピュートソースタイプ]
[maxcompute] を選択します。
[エンドポイント]
デフォルトのエンドポイントは Dataphin インスタンス コンピュートエンジンのエンドポイントであり、変更できません。
[accesskey ID]
AccessKey ID は、ユーザー情報管理ページから取得できます。
[accesskey Secret]
AccessKey Secret は、ユーザー情報管理ページから取得できます。
[maxcompute プロジェクト]
dataphin_tutorial (Alibaba Cloud で作成された MaxCompute (ODPS) プロジェクトの名前) と入力します。
[外部プロジェクト]
このオプションは選択しないでください。
[コンピュートソース名]
dataphin_tutorial と入力します。
[説明]
dataphin_tutorial プロジェクトのオフラインコンピュートソース と入力します。
[検証して送信] をクリックして、コンピュートソースの作成を完了します。
コンピュートソースの各パラメーターの構成の詳細については、「MaxCompute コンピュートソースを作成する」をご参照ください。
ステップ 3:プロジェクトを作成する
Dataphin ホームページの上部にあるメニューバーで、[計画] > [プロジェクト] を選択します。
[プロジェクト管理] ページで、[一般プロジェクトを作成] をクリックします。[本番開発タイプ] ステップで、[基本モード] を選択し、[次へ] をクリックします。
[プロジェクト定義] ステップで、所属ブロック、基本情報、ビジネス情報、セキュリティ設定、その他の設定を構成します。
パラメーター
説明
[ビジネスユニット]
dataphin_tutorial を選択します。
[プロジェクト英語名]
dataphin_tutorial と入力します。
[プロジェクト名]
dataphin_tutorial と入力します。
[コンピュートソースタイプ]
[オフラインエンジン]:[オフラインエンジン] を有効にし、[maxcompute] を選択します。
[MAXC]:[dataphin_tutorial] で作成した [maxcompute] コンピュートソースを選択します。
[プロジェクトのデフォルト リソースグループ]: このプロジェクトのタスクによって生成されたインスタンスのスケジューリングに使用されるデフォルトのリソースグループです。タスク構成中に、単一のタスクに対応するリソースグループを変更するようにカスタマイズできます。関連付けられていて使用可能なリソースグループのみを選択できます。[テナントのデフォルト リソースグループ] を選択するか、新しいリソースグループを作成できます。新しいリソースグループの作成の詳細については、「カスタム リソースグループを作成する」をご参照ください。
[空間タイプ]
[一般レイヤー] を選択します。
説明空間タイプのオプションには、[アプリケーションレイヤー]、[中間レイヤー]、[ソースレイヤー]、[一般レイヤー] があります。
[アプリケーションレイヤー] (ADS):ビジネスニーズに基づいてさまざまなシナリオに適用できるパーソナライズされた多様なデータメトリックを定義します。
[中間レイヤー] (CDM):処理、スクラブ、および集計されたデータ。
[ソースレイヤー] (ODS):STG レイヤーでのデータ処理と集計後に形成されるビジネスシステムの生データ。
[一般レイヤー]:通常、一般的なタスク、または複数のタイプのタスクを同時に開発するために使用されます。
[セキュリティ設定]
[デフォルト構成] を使用します。
[詳細設定]
[デフォルト構成] を使用します。
[確認] をクリックして、プロジェクトの作成を完了します。
プロジェクトの各パラメーターの構成の詳細については、「一般プロジェクトを作成する」をご参照ください。
ステップ 4: ソースデータソースを作成する
Dataphin ホームページの上部にあるメニューバーで、[管理センター] > [データソース管理] を選択します。
[データソース] ページで、[+ 新規データソース] をクリックします。[リレーショナルデータソース] 領域で、[mysql] を選択します。
[mysql データソースを作成] ダイアログボックスで、データソース情報を構成します。
パラメーター
説明
[データソース名]
dataphin_tutorial と入力します。
[バージョン]
[mysql8] を選択します。
[データソースの説明] (オプション)
データソースの簡単な説明を入力します。たとえば、入門チュートリアルのソースデータ です。
[データソース構成]
["production" データソース] を選択します。
[タグ] (オプション)
デフォルト [未入力]。
[JDBC URL]
jdbc:mysql://host:port/dataphinの形式を入力します。host:port情報は、MySQL インスタンス 製品ページで確認できます。重要接続 URL では、Dataphin の IP アドレスがデータベースの許可リストに設定されていることを確認してください。設定されていない場合、接続に失敗する可能性があります。
イントラネットアドレスを使用する場合は、データベースと Dataphin インスタンスが同じリージョンにあることを確認してください。
[ユーザー名]、[パスワード]
dataphin と入力します。
[SSL 暗号化]
MySQL データソースが SSL 暗号化で構成されている場合は、[有効化] を選択し、[トラストストア証明書] をアップロードして、[トラストストア証明書のパスワード] を入力して暗号化伝送を行うことができます。
[詳細設定]
[デフォルト構成] を使用します。
[接続テスト] をクリックします。
接続テストが成功したら、[確認] をクリックして、データソースの作成を完了します。
データソースの各パラメーターの構成の詳細については、「MySQL データソースを作成する」をご参照ください。