新しいデータプロジェクトを開始する際には、無秩序な状態やセキュリティリスクを防ぐために、コード、リソース、チームメンバーを分離する必要があります。DataWorks のワークスペースは、プロジェクトベースのコンテナであり、開発タスク、コンピューティングリソース、メンバーの権限を管理するのに役立ち、安全で秩序ある効率的なチームコラボレーションを実現します。
最初に「ワークスペースの概要」をお読みいただくことを推奨します。
クイックスタート
経験豊富なユーザーは、以下の手順に従って、本番環境に適した標準ワークスペースを迅速に作成できます。
-
DataWorks ワークスペースリスト に移動し、ページ上部で正しいリージョンが選択されていることを確認してから (リージョンはワークスペース作成後に変更できません)、ワークスペースの作成 をクリックします。
-
作成ページで、以下の主要なパラメーターを設定します。
-
ワークスペース名:チームの命名規則に準拠した一意の名前を入力します。
-
本番環境と開発環境の分離:このオプションを有効にします。これにより、標準モードのワークスペースが作成され、開発環境と本番環境が分離されます。
-
新しいバージョンのData Development (Data Studio) を使用する:このオプションを有効にして、新しいバージョンの Data Studio を使用することを推奨します。
このオプションが表示されない場合は、デフォルトで有効になっています。ページで PAI のサービスリンクロールを承認するなどの操作を求められた場合は、画面の指示に従ってから続行してください。
-
-
ワークスペースの作成 をクリックします。
ワークスペースが作成されたら、次のステップとしてコンピューティングリソースを関連付けます。
権限
ワークスペースを作成するには、アカウントが以下の要件のいずれかを満たしている必要があります。
-
Alibaba Cloud アカウントであること。
-
AliyunDataWorksFullAccessまたはCreateWorkspaceのアクセスポリシーが付与された RAM ユーザーであること。詳細については、「RAM ユーザーへの権限付与」をご参照ください。
事前準備
ワークスペースを作成する前に、その設定を計画し、適切なモードを選択する必要があります。
|
アクション |
[説明] |
リファレンス |
|
ワークスペースの計画 |
ワークスペースは、DataWorks における業務分離の最大の単位です。ワークスペースを使用する前に、特定のビジネスシナリオに適した分離計画を設計してください。 |
|
|
ワークスペースモードの選択 |
DataWorks は、基本モードと標準モードの 2 つのワークスペースモードを提供します。
すべての本番プロジェクトで標準モードを使用することを強く推奨します。 |
[ワークスペースの作成]
ステップ1:リージョンとタイムゾーンの選択
ワークスペースはリージョン固有です。ワークスペースを作成する前に、まずビジネスデータが格納されているリージョンを選択する必要があります。
-
DataWorks ワークスペースリスト に移動します。
-
コンソールの上部メニューで、目的のリージョンを選択します。
重要リージョンはワークスペース作成後に変更できません。リージョンを選択する前に、以下の情報を確認してください。
-
リージョンとタイムゾーンの関係:
-
デフォルトのスケジューリングタイムゾーン:ワークスペースのスケジューリングタイムゾーンは、そのリージョンのタイムゾーンにデフォルトで設定されます。たとえば、[中国北部2 (北京)] リージョンのデフォルトのスケジューリングタイムゾーンは UTC+8 です。デフォルトのタイムゾーンが要件を満たさない場合は、次の「複数タイムゾーンのサポート」の項目をご参照ください。
-
複数タイムゾーンのサポート:一部のリージョンでは、手動で他のスケジューリングタイムゾーンに切り替えることができます。「スケジューリングタイムゾーンの切り替え」を参照し、選択したリージョンがこの機能をサポートしているか、またどのタイムゾーンが利用可能かを確認してください。
-
-
夏時間 (DST) の影響:選択したリージョンが DST を採用している場合 (例:ドイツ (フランクフルト)、米国 (バージニア))、タイムゾーンの変更がスケジュールされたタスクに予期せず影響を与えないように、「シナリオ:DST 切り替えがスケジュールされたタスクに与える影響」を必ずお読みいただくことを強く推奨します。
-
ステップ2:ワークスペースの作成
デフォルトのワークスペースについて:システムは default_workspace_xxxx という名前の組み込みワークスペースを提供します。これは迅速な機能確認のみを目的としており、本番環境での使用は禁止されています。これは、権限がオープンで環境が分離されていない基本モードのワークスペースです。詳細については、「組み込みのデフォルトワークスペース」をご参照ください。
-
ワークスペース ページで、ワークスペースの作成 をクリックして作成ページに移動します。
-
作成ページで、次の表の説明に従ってパラメーターを設定します。
パラメーター
[説明]
[基本情報]
[ワークスペース名]
ワークスペースの一意の識別子。この名前は作成後に変更できません。
名前は、同じリージョンまたはテナント内で一意である必要があります。正確な一意性の要件は、作成ページの検証プロンプトに従ってください。
[表示名]
識別しやすくするために、ワークスペースのビジネス目的がわかる名前を推奨します。
コアモードと機能
[本番環境と開発環境の分離]
ワークスペースモードを定義します。これにより、開発環境と本番環境を分離するかどうかが決まります。
-
[開く]:開発環境と本番環境を分離します。これにより、[標準モード]のワークスペースが作成されます。
-
[閉じる]:開発環境と本番環境を分離しません。これにより、[基本モード]のワークスペースが作成されます。
本番環境では、このオプションを有効にすることを推奨します。
[新しいバージョンのData Development (Data Studio) を使用する]
新しい Data Studio の最新機能をご利用いただくため、このオプションを有効にすることを推奨します。このオプションを有効にしない場合、従来の Data Studio が使用されます。
重要このオプションが表示されない場合、通常は新しい Data Studio がデフォルトで有効になっていることを示します。スイッチが利用できない、または次のステップに進めない場合は、作成ページのエラーメッセージとガイド (PAI のサービスリンクロールの承認を含む) に従い、再度お試しください。
[Workspaceテンプレート]
ワークスペーステンプレートは、DataWorks ワークスペースで利用可能なツール、リソース、および機能を定義します。
ワークスペーステンプレートを選択した後、要件に基づいてコンピューティングリソースとデータソースを追加できます。詳細については、「ワークスペーステンプレートの概要」をご参照ください。
[詳細設定]
[スペース管理者]
このワークスペースの管理者を定義します。デフォルトでは、現在ログインしているアカウントが管理者です。ワークスペース管理の補助として、他の RAM ユーザーを管理者として追加できます。ワークスペース管理者ロールには広範な権限があるため、慎重に付与してください。詳細については、「[非推奨] ワークスペース管理者の責任」をご参照ください。
[Paiアルゴリズムタスクのスケジューリング]
このワークスペースと同じ名前の AI ワークスペースを作成するかどうかを指定します。現在のリージョンで Machine Learning PAI が有効化されている場合、このオプションはデフォルトで有効になります。そうでない場合は、このスイッチをオンにする前に PAI を有効化する必要があります。有効にすると、AI ワークスペースで PAI アルゴリズムタスクをスケジュールできます。
ワークスペース作成時にこのオプションが有効になっていない場合でも、後で共通設定 ページで PAIアルゴリズムタスクのスケジューリング スイッチを有効にすることができます。この操作は、作成時に本オプションを選択するのと同じ効果があります (どちらも現在のワークスペースに PAI モジュールを関連付けます)。ワークスペース管理者のみがこの操作を実行でき、一度有効にすると無効にすることはできません。詳細については、「ワークスペースの設定」をご参照ください。
[デフォルトのリソースグループ設定]
ワークスペースで実行されるタスクに使用されるデフォルトの DataWorks リソースグループ。この設定は、後でワークスペース設定で変更できます。
このオプションが表示されない場合は、ワークスペース作成後に、ワークスペース設定または Data Studio のスケジューリング設定でデフォルトの DataWorks リソースグループを設定できます。
[Alibaba Cloudリソースグループ]
Alibaba Cloud のリソース管理で作成されたリソースグループを選択します。デフォルトでは、デフォルトのリソースグループ が選択されます。
複数の Alibaba Cloud リソースを購入した場合、リソース管理を使用してリソースグループを作成し、リソースをより適切に整理できます。また、各グループに管理者を割り当てて、その中のすべてのリソースを独立して管理することもできます。
重要このリソースグループは、Alibaba Cloud アカウント内のリソースを整理し、リソースのグループ化と権限管理の簡素化に役立ちます。これは、タスクを実行するために必要な DataWorks リソースグループ とは異なります。2 つの概念を混同しないでください。
-
ステップ3:コンピューティングリソースの関連付け
ワークスペースを作成した後、ビッグデータ開発タスクを実行するために、MaxCompute などのコンピューティングリソースを関連付ける必要があります。
-
新しいバージョンのData Development (Data Studio) を使用する を有効にした場合、自動的にコンピューティングリソースを関連付けるページにリダイレクトされます。詳細な手順については、「コンピューティングリソースの関連付け」をご参照ください。
コンピューティングリソースをまだ準備していない場合は、ワークスペース作成後に 閉じる をクリックして、後で関連付けることができます。
-
新しいバージョンのData Development (Data Studio) を使用する を有効にしなかった場合、自動的に DataWorks ワークスペースリスト にリダイレクトされます。ここでワークスペースに関する情報を表示できます。詳細については、「ワークスペースの設定」をご参照ください。ワークスペース作成後、同様にコンピューティングリソースを関連付ける必要があります。関連付けが完了して初めて、データ開発を実行できます。
本番環境でのベストプラクティス
-
モードの選択:開発環境と本番環境を分離するために、[標準モード]の使用を推奨します。
-
命名規則:財務税務レポートプロジェクトには
finance_tax_reportのように、ビジネス上の意味が明確にわかる名前を使用するための統一基準を確立してください。 -
タイムゾーンの確認:複数の国にまたがって業務を行うチームは、ワークスペースを作成する前にスケジューリングタイムゾーンのポリシーを確認する必要があります。
次のステップ
-
ワークスペースを作成したら、ワークスペースにメンバーを追加する必要があります。
-
ワークスペースの設定を表示または変更したり、ワークスペースを削除または無効化したりするには、「ワークスペースの設定」をご参照ください。
付録
ワークスペーステンプレート
|
[ワークスペース名] |
適用シナリオ |
機能 |
サポートされているリージョン |
|
DataWorks ワークスペース |
幅広いビジネスシナリオに適しています。必要に応じてコンピューティングリソースとデータソースを設定できます。 |
DataWorks エディションの機能に基づいた、完全に設定可能なワークスペースモードです。 |
DataWorks がデプロイされているすべてのリージョン。 |
|
[OpenLakeワークスペース] |
ビッグデータ/検索/AI 統合ソリューション向けのワークスペースで、オープンで管理可能なデータレイクハウスアーキテクチャ上に構築されています。 |
|
OpenLake ワークスペースは、中国 (杭州)、中国 (上海)、中国 (北京)、中国 (深圳) リージョンでのみ作成できます。 |
組み込みのデフォルトワークスペース
初めて DataWorks を使用する場合、または新しいリージョンで有効化する場合、広範な準備なしで迅速に利用を開始できるよう、DataWorks は以下の操作を自動的に実行します。
-
デフォルトのワークスペースを自動的に作成します (名前は
default_workspace_で始まります)。 -
デフォルトの従量課金リソースグループを自動的に作成します (名前は
dataworks_default_resource_group)。 -
MaxCompute プロジェクトを自動的に作成し、コンピューティングリソースとして関連付けます (名前は
default_datasource_で始まります)[。] -
新しく購入したリソースグループをデフォルトのワークスペースに自動的に関連付けます。
本番タスクにデフォルトのワークスペースを使用することは推奨しません。
デフォルトワークスペースとユーザー作成ワークスペースの比較:基本プロパティ
以下の表は、デフォルトのワークスペースとユーザーが作成したワークスペースのプロパティを比較したものです。
|
プロパティ |
システムデフォルトワークスペース |
ユーザー作成ワークスペース |
|
[ワークスペース名] |
default_workspace_4桁のランダムコード。変更できません。 |
カスタム。作成後に変更できません。 |
|
[表示名] |
|
カスタム。作成後に変更できます。 |
|
ワークスペースモード |
基本モードのワークスペース。新しい Data Studio が有効になっているワークスペースは、標準モードにアップグレードできません。新しい Data Studio が有効になっていない場合は、アップグレード可能です。 |
基本モードまたは標準モードのワークスペースを作成することを選択できます。 |
|
[スペース管理者] |
デフォルトの管理者は、誰が DataWorks を有効化するかによって異なります。
|
システムデフォルトワークスペースと同じです。 |
|
ワークスペースのスケジューリングタイムゾーン |
スケジューリングタイムゾーンは、デフォルトでリージョンのタイムゾーンに設定されます。変更するには、「スケジューリングタイムゾーンの切り替え」をご参照ください。 |
システムデフォルトワークスペースと同じです。 |
デフォルトワークスペースとユーザー作成ワークスペースの比較:可視性とアクセス
|
機能 |
システムデフォルトワークスペース |
ユーザー作成ワークスペース |
|
コアロジック |
オープン/デフォルトアクセスモデル |
招待ベース/許可リストモデル |
|
[可視性] |
全体に公開:現在のテナントのすべてのメンバーに表示されます。 |
可視性の制限:明示的にワークスペースに追加されたメンバーにのみ表示されます。 |
|
アクセス方法 |
テナントのどのメンバーもワークスペースにアクセスできます。 |
メンバーがアクセスするには、ワークスペース管理者が手動でメンバーを追加する必要があります。 |
|
ロールロジック |
自動付与:メンバーが初めてワークスペースにアクセスすると、システムは自動的にゲストロールを付与します。 |
明示的な割り当て:メンバーを追加する際に、そのロールはワークスペース管理者によって明示的に割り当てられます。 |