このトピックでは、DataWorks のさまざまなシナリオにおけるワークスペース作成計画について説明します。
ワークスペース権限モデル
| サービス | 権限モデル |
| ワークスペース管理 | ワークスペース管理の権限は、ワークスペース間で[完全に分離]されています。 ビジネス要件に基づいて、ワークスペースごとに管理者とメンバーを指定できます。メンバーのロール設定と計算エンジンインスタンスのパラメーターは、ワークスペース間で独立しています。 説明 Alibaba Cloud アカウントのみがワークスペースの所有者になることができます。 |
| DataStudio | データ開発の権限は、ワークスペース間で[完全に分離]されています。
説明 ワークスペース内のノードは、別のワークスペース内のノードに依存できます。 |
| オペレーションセンター | オペレーションセンターサービスの権限は、ワークスペース間で[部分的に分離]されています。
|
| データマップ | データマップサービスの権限は、[テナントのすべてのワークスペースで共有]されます。 データマップでは、現在のリージョンのテナントのすべてのワークスペースのメタデータを検索および表示できます。 説明 データマップに表示されるメタデータのみが、テナントのすべてのワークスペースで共有されます。データの読み取りおよび書き込み権限は、テナントのワークスペース間で分離されています。ほとんどの場合、開発環境のデータの読み取りおよび書き込み権限は、すべてのワークスペースで開発ロールが割り当てられているメンバーによって共有されます。テナントアカウントのみが、本番環境のデータを管理する権限を持ちます。 |
| データ品質 | データ品質サービスの権限は、ワークスペース間で[完全に分離]されています。 開発、O&M、またはワークスペースマネージャーロールが割り当てられているワークスペースメンバーのみが、ワークスペースでデータ品質監視ルールを構成する権限を持ちます。 |
| DataService Studio | DataService Studio サービスの権限は、ワークスペース間で[部分的に分離]されています。 ワークスペースは API グループの定義を共有します。ただし、ワークスペースに登録または公開されている API は、そのワークスペースでのみ表示されます。 |
| データセキュリティガード | データセキュリティガードサービスの権限は、[すべてのワークスペースで共有]されます。 ワークスペースは、一連のデータセキュリティルールと、機密データの一連のデータセキュリティレベルを共有します。[アクセスモード] パラメーターに [安全] を選択した場合、安全マネージャーロールが割り当てられているワークスペースメンバーのみが、データセキュリティガードで操作を実行する権限を持ちます。 |
ワークスペース作成計画の実践
| ディメンション | 部門 | ビジネスプロジェクト | データレイヤー |
| ワークスペース作成計画基準 | 企業の組織構造に基づいてワークスペースを作成できます。 たとえば、生産部門、マーケティング部門、人事部門、財務部門などの部門のワークスペースを作成できます。特定の部門用に作成されたワークスペースは、その部門のデータ開発とテーブル管理に使用できます。 | ビジネスプロジェクトの計画に基づいてワークスペースを作成できます。 たとえば、四半期売上スプリントプロジェクト、春の生産セキュリティ検査プロジェクト、エグゼクティブコックピットレポートプロジェクトなどのビジネスプロジェクトのワークスペースを作成できます。各ビジネスプロジェクトには複数の部門が関与しています。この場合、各ワークスペースは複数のビジネスシステムからデータを取り込み、取り込んだデータを処理および集計して、各ビジネスプロジェクトをサポートします。 | データレイヤーごとに 1 つ以上のワークスペースを作成できます。 たとえば、データアクセスレイヤー、Operational Data Store(ODS)レイヤー、Data Warehouse Summary(DWS)レイヤーなどのデータレイヤーのワークスペースを作成できます。 |
| シナリオ | 次の条件が満たされている場合、このディメンションからワークスペースを作成できます。部門のビジネス要件が単純です。部門のスタッフは熟練した開発者です。部門間でのデータ共有の需要が少ない。単一の部門がエンドツーエンドのビジネス開発を実行できます。 | ビジネスプロジェクトの優先順位が高い企業、またはビジネスプロジェクトのために複数の部門間で共同作業が必要な企業のために、このディメンションからワークスペースを作成できます。 | 大規模なデータウェアハウス、企業の共通レイヤー、データミッドエンドのために、このディメンションからワークスペースを作成できます。 |
| 利点 | 企業の組織構造に基づいてワークスペースメンバーが追加されます。このディメンションから作成されたワークスペースは、人的資源とデータセキュリティの安定性を最大化します。さらに、コンピューティングコストとストレージコストは部門ごとに簡単に計算できます。 | このディメンションから作成されたワークスペースでは、ビジネス要件が具体的であり、データリンクが明確であり、データ O&M 操作を簡単に実行できます。ビジネス要件に基づいて、ワークスペースメンバーの責任を調整できます。 | データアーキテクチャが明確で、データ共有が便利で、必要な開発スキルが少なく、各データレイヤーの特性に基づいてリソースを割り当てることができます。 |
| 欠点 | 異なる部門のデータはサイロ化される傾向があります。データが繰り返し計算および格納される可能性があります。異なるワークスペース間のデータ依存関係は複雑であり、異なるワークスペース間でリソースがプリエンプトされる傾向があります。 | データアーキテクチャが不明確であり、異なるワークスペースが異なるビジネスロジックを実装しています。ワークスペースのメンバーは異なる部門から来る場合があり、データセキュリティのリスクが高くなります。 | 相互に依存するノードが異なるワークスペースで開発される可能性があるため、開発サイクルと O&M リンクが長くなります。標準モードのワークスペースでは、ノードのコードが変更およびデプロイされた場合、現在のノードと依存関係があり、他のワークスペースにデプロイされているノードのコードも、ノードがデプロイされる前に変更する必要があります。 |
| アーキテクチャの安定性 | ★★★★★ | ★☆☆☆☆ | ★★★★★ |
| 人事管理の柔軟性 | ★☆☆☆☆ | ★★★★★ | ★★★★☆ |
| ビジネスの複雑さ | ★★☆☆☆ | ★★★★☆ | ★★★☆☆ |
| データセキュリティ | ★★★★★ | ★★☆☆☆ | ★★★☆☆ |
| 保守性 | ★★☆☆☆ | ★★★★★ | ★★☆☆☆ |
| データ共有 | ★★★☆☆ | ★☆☆☆☆ | ★★★★★ |
- データアクセスレイヤー: このデータレイヤーでは、stg_Marketing システムや stg_Production 管理システムなどのアプリケーションシステムのワークスペースを作成できます。
- ノード: Data Integration ノードのみが作成されます。
- テーブル: 生データを格納し、有効期間(TTL)が短いテーブルのみが作成されます。
- ワークスペースメンバー: アプリケーションシステム用に作成されたワークスペースでは、アプリケーションシステムのデータベース管理者(DBA)がワークスペースのメンバーとして追加されます。
- このシナリオで最初に割り当てられるリソース: Data Integration のリソースグループとストレージリソース。
- ODS レイヤー: このデータレイヤーでは、ods_人事部や ods_生産部などの部門のワークスペースを作成できます。部門用に作成されたワークスペースのデータは標準化されており、機密データは除外されています。
- ノード: 単一の祖先ノードと単一の子孫ノードを持つ SQL ノードのみが作成されます。
- テーブル: ODS レイヤーのテーブルのみが作成されます。
- ワークスペースメンバー: 部門用に作成されたワークスペースでは、部門のデータクレンジング担当者がワークスペースのメンバーとして追加されます。
- このシナリオで最初に割り当てられるリソース: 00:00 から 02:00 までの期間に実行するようにスケジュールされたノードを実行するために使用されるスケジューリングのリソースグループ、および計算エンジンインスタンスの計算リソース。
- Data Warehouse Summary(DWS)レイヤー: このデータレイヤーに 1 つのワークスペースを作成するか、dw_顧客ドメインや dw_商品ドメインなどのビジネスドメインに複数のワークスペースを作成できます。
- ノード: 複数の祖先ノードと単一の子孫ノードを持つ SQL ノードのみが作成されます。
- テーブル: DWS レイヤーのファクトテーブルとディメンションテーブルのみが作成されます。
- ワークスペースメンバー: DWS レイヤーなどの共通レイヤーのビジネスドメイン用に作成されたワークスペースでは、ビジネスドメインのプロの開発者がワークスペースのメンバーとして追加されます。
- このシナリオで最初に割り当てられるリソース: 02:00 から 05:00 までの期間に実行するようにスケジュールされたノードを実行するために使用されるスケジューリングのリソースグループ、計算エンジンインスタンスの計算リソース、およびストレージリソース。割り当てられたストレージリソースは、データの拡張に対処するために使用されます。
- タグデータモデル(TDM)レイヤー: このデータレイヤーに 1 つのワークスペースを作成するか、このデータレイヤーのビジネスオブジェクトに複数のワークスペースを作成できます。
- ノード: 複数の祖先ノードと単一の子孫ノードを持つ SQL ノードのみが作成されます。
- テーブル: タグテーブルのみが作成されます。
- ワークスペースメンバー: TDM レイヤーなどの共通レイヤーのビジネスオブジェクト用に作成されたワークスペースでは、ビジネスオブジェクトのプロの開発者がワークスペースのメンバーとして追加されます。
- このシナリオで最初に割り当てられるリソース: 05:00 から 07:00 までの期間に実行するようにスケジュールされたノードを実行するために使用されるスケジューリングのリソースグループ、計算エンジンインスタンスの計算リソース、およびストレージリソース。割り当てられたストレージリソースは、データの拡張に対処するために使用されます。
- アプリケーションデータストア(ADS)レイヤー: このデータレイヤーでは、ビジネスプロジェクトのワークスペースを作成できます。
- ノード: SQL ノードと Data Integration ノードが作成されます。
- テーブル: 特定のビジネスプロジェクトのテーブルが最初に作成されます。
- ワークスペースメンバー: ビジネスプロジェクト用に作成されたワークスペースでは、ビジネスプロジェクトのメンバーがワークスペースのメンバーとして追加されます。
- このシナリオで最初に割り当てられるリソース: 07:00 から 09:00 までの期間に実行するようにスケジュールされたノードを実行するために使用されるスケジューリングのリソースグループ、計算エンジンインスタンスの計算リソース、および Data Integration のリソースグループ。