チームが DataWorks で共同開発を行う際、プロジェクトの分離、権限の割り当て、計算リソースの管理などの課題に直面することがあります。ワークスペースは、これらの問題を解決するためのコアユニットです。ワークスペースは、開発タスクの整理、メンバーへのロールの割り当て、必要なコンピュートエンジンのアタッチが可能な独立した環境を提供します。これにより、秩序だった、安全で、効率的なデータ開発プロセスが保証されます。
ワークスペースの概要
ワークスペースは、DataWorks でタスクを開発し、メンバーの権限を管理するための基本単位です。DataWorks でのすべての開発作業は、ワークスペース内で行われます。ワークスペースは、複数のデータソースを使用して保存データを管理できます。また、タスク開発やタスクスケジューリングなどの操作のために、複数の計算リソースをアタッチすることもできます。ワークスペース管理者は、メンバーをワークスペースに追加し、異なるロールを割り当てます。これらのロールには、ワークスペース管理者、データアナリスト、デプロイヤー、開発者、データガバナンス管理者、モデルデザイナー、ビジター、O&M、プロジェクトオーナー、セキュリティ管理者が含まれます。これにより、複数ロールのコラボレーションを必要とするビジネスシナリオが可能になります。
ワークスペースタイプの選択
DataWorks は、基本モードと標準モードの 2 つのワークスペースモードを提供します。この 2 つのモードは、開発動作とデータセキュリティが異なります。実際の開発では、標準モードのワークスペースを使用することをお勧めします。詳細については、「ワークスペースモードの違い」および「ワークスペースモードのアップグレード」をご参照ください。
ワークスペースのコア操作
コア操作 | 説明 | リファレンス | |
ライフサイクル管理 | ワークスペースの作成 | さまざまなビジネスシナリオに合わせてワークスペースを計画および作成し、ビジネスの分離を実装します。 DataWorks には、新規ユーザーが迅速にサービスを試すための組み込みのデフォルトワークスペースがあります。このワークスペースを本番タスク開発に使用しないでください。デフォルトのワークスペースとカスタムワークスペースの違いの詳細については、「組み込みのデフォルトワークスペース」をご参照ください。 | |
ワークスペースの削除 | ワークスペースとそのアセットが不要になった場合は、ワークスペースを削除します。これにより、リソースが完全にクリーンアップされ、潜在的な課金やデータの残留を防ぐことができます。 | ||
ワークスペースの無効化 | 一時的にワークスペースが不要になったが、そのコードと構成を保持したい場合は、ワークスペースを無効にします。これにより、タスクスケジューリングは一時停止しますが、既存データは保持されるため、後でワークスペースを有効にすることができます。 | ||
ワークスペース情報の設定 | ワークスペースの構成を表示します。ワークスペースモードのアップグレードなど、一部の構成を変更することもできます。 | ||
リソース構成 | 計算リソースのアタッチ | MaxCompute、EMR Serverless Spark、Hologres などの計算リソースをアタッチして、ワークスペースでタスク開発や定期的なスケジューリングなどの操作を実行します。 計算リソースをアタッチすると、システムは対応するデータソースを自動的に作成します。 | |
データソースの追加 | MaxCompute、E-MapReduce、ClickHouse などのデータソースを追加して、さまざまなデータストレージサービスに接続します。これらのサービスは、DataWorks でのタスク実行のデータソースとして機能し、データ同期と分析の基盤を提供します。 重要 データソースを作成する前に、「ワークスペースモードの違い (基本モードと標準モード)」をご参照ください。データ開発プロセスとアクセスの制御は、選択したモードの機能に依存します。 | ||
リソースグループのアタッチ | DataWorks リソースグループは、タスクを実行するために必要な計算能力の単位です。リソースグループをワークスペースにアタッチして、計算能力を管理します。 | ||
チームと権限 | メンバーロールの計画と割り当て |
重要 権限を割り当てる前に、DataWorks の「ワークスペースレベルの権限モデル」をご参照ください。 | |
本番環境での使用に関する推奨事項
ワークスペースを計画および作成する際は、次のガイドラインに従ってください:
事前のワークスペース計画: ワークスペースを作成する前に、「ワークスペースの計画」をご参照ください。将来の管理上の問題を避けるために、LOB、プロジェクト、またはデータドメインに基づいて、よく構造化された組織図を設計します。
明確なワークスペース名: 明確なビジネス上の意味を持つ名前を使用します。たとえば、金融ドメインの税務レポートプロジェクトには
finance_tax_reportを使用します。ノードが複数のワークスペース間で参照される場合は、迅速に識別できるようにノード名にワークスペース名の略称を含めます。
ワークスペースモード: 標準モードは、開発環境と本番環境間の物理的な分離をサポートします。実際の開発では、標準モードのワークスペースを使用することをお勧めします。
ワークスペースの権限: Alibaba Cloud アカウントでワークスペースを作成し、RAM ユーザーにワークスペース管理者ロールを付与する必要があります。ベストプラクティスとして、ユーザーは開発者ロールと O&M ロールを同時に持つべきではありません。
デフォルトのワークスペース: 本番タスクの開発にデフォルトのワークスペースを使用しないでください。
次のステップ
ワークスペースを作成し、そのメンバーにロールを割り当てた後、データ統合、データ開発、データ分析などの操作を実行できます。