すべてのプロダクト
Search
ドキュメントセンター

DataWorks:旧バージョンの DataStudio を体験する

最終更新日:Nov 09, 2025

このチュートリアルでは、DataWorks と MaxCompute のプロダクトポートフォリオを使用してビッグデータの開発と分析を行う方法について説明します。ユーザープロファイル分析の例を使用して、データ統合、データ開発、オペレーションセンターにおける DataWorks の機能を示します。

チュートリアルの概要

より良いビジネス戦略を立てるために、ウェブサイトユーザーのオンラインでの行動から、そのユーザーに関する基本的なプロファイルデータを取得できます。このデータには、地理的および社会的属性が含まれます。その後、スケジュールされた時間にプロファイル分析を実行して、詳細なウェブサイトトラフィック操作を行うことができます。DataWorks と MaxCompute のプロダクトポートフォリオを使用して、データ同期、データ変換、データ管理、およびデータ消費を完了できます。

説明

このチュートリアルに従うには、「チュートリアルの目的と設計」を読んで、ユーザーペルソナ分析の全体的なフローを理解してください。

データ開発プラットフォーム

このチュートリアルでは、DataWorks の 旧バージョンの DataStudio を使用します。ワークスペースで [新しいバージョンの Data Studio] を使用しないようにしてください。

  • ワークスペースを作成する際、[新しいデータ開発 (DataStudio) を使用する] オプションを選択しないでください。

  • 2025 年 2 月 18 日以降、Alibaba Cloud アカウントを使用して DataWorks をアクティブ化し、次のいずれかのリージョンで初めてワークスペースを作成すると、新しいバージョンの Data Studio がデフォルトで有効になります。アカウントで新しいバージョンの Data Studio がデフォルトで有効になっている場合は、「新しいバージョンの Data Studio を体験する」をご参照ください。

    中国 (杭州)、中国 (上海)、中国 (北京)、中国 (張家口)、中国 (ウランチャブ)、中国 (深セン)、中国 (成都)、中国 (香港)、日本 (東京)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、タイ (バンコク)、ドイツ (フランクフルト)、英国 (ロンドン)、米国 (シリコンバレー)、米国 (バージニア)

手順

  1. 環境を準備する

    このチュートリアルに必要な MaxCompute プロジェクトと DataWorks ワークスペースを作成します。次に、リソースグループのネットワーク構成を完了します。

  2. データを同期する

    DataWorks で、データ同期タスクを構成して、このチュートリアルで提供されるユーザー情報とウェブサイトのログデータを MaxCompute に同期します。次に、同期されたデータをクエリします。

  3. データを変換する

    DataWorks の MaxCompute SQL ノードを使用して、MaxCompute に同期されたユーザー情報テーブルとアクセスログテーブルのデータを変換します。このプロセスにより、ターゲットのユーザープロファイルデータが生成されます。

  4. データ品質を監視する

    データ変換から生成されたテーブルに対してデータ品質監視ルールを構成します。これにより、ダーティデータを早期に特定してブロックし、その影響が広がるのを防ぐことができます。

  5. データを管理する

    ユーザープロファイル分析タスクフローが完了すると、対応するデータテーブルが MaxCompute に作成されます。データマップモジュールで生成されたテーブルを表示し、そのデータリネージをチェックして、それらの間の関係を確認できます。

  6. データを消費する

    • ユーザープロファイル分析が完了したら、DataAnalysis モジュールを使用して変換されたデータを可視化できます。これにより、データから主要な情報をすばやく抽出し、ビジネスの傾向に関するインサイトを得ることができます。

    • 最終的に変換されたデータを取得した後、DataService Studio モジュールを使用して、標準の API データサービスを介してデータを共有および使用できます。これにより、API を介してデータを受信する他のビジネスモジュールにデータが提供されます。