このチュートリアルでは、DataWorks と MaxCompute のプロダクトポートフォリオを使用してデータ開発と分析を行う方法を説明します。ユーザーペルソナ分析シナリオを使用して、Data Integration、Data Studio、オペレーションセンターなどの DataWorks モジュールの機能を紹介します。
はじめに
より良いビジネス戦略を立てるために、ウェブサイト上のユーザーの動作を分析できます。この分析は、地理的属性や社会的属性などのデータを使用して、基本的なユーザーペルソナを構築するのに役立ちます。その後、スケジュールされた分析を実行して、詳細なトラフィック操作を行うことができます。DataWorks と MaxCompute のプロダクトポートフォリオを使用して、データの同期、変換、管理、および消費を行うことができます。
このチュートリアルを進めるには、チュートリアルの目的と設計 を読んで、ユーザーペルソナ分析の全体的なフローを理解してください。
Data Studio
このチュートリアルでは、DataWorks の 新しい DataStudio プラットフォームを使用します。ワークスペースで新しい DataStudio が有効になっていることを確認してください。次のように有効にできます:
ワークスペースを作成する際に、[Data Studio (新バージョン) を使用] を選択します。
古い DataStudio バージョンからアップグレードするには、インターフェイスの上部にある [アップグレード] ボタンをクリックします。その後、画面の指示に従ってアップグレードを完了します。
2025 年 2 月 18 日以降、Alibaba Cloud アカウントが初めて DataWorks を有効にし、次のリージョンでワークスペースを作成すると、新しい DataStudio がデフォルトで有効になります:
中国 (杭州)、中国 (上海)、中国 (北京)、中国 (張家口)、中国 (ウランチャブ)、中国 (深圳)、中国 (成都)、中国 (香港)、日本 (東京)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、タイ (バンコク)、ドイツ (フランクフルト)、イギリス (ロンドン)、米国 (シリコンバレー)、米国 (バージニア)
手順
必要な MaxCompute プロジェクトと DataWorks ワークスペースを作成します。次に、リソースグループのネットワークを設定します。
DataWorks で、データ同期タスクを設定します。このタスクは、提供されたユーザー情報とウェブサイトのログデータを MaxCompute に同期します。次に、同期されたデータをクエリします。
DataWorks の MaxCompute SQL ノードを使用して、ユーザー情報テーブルとアクセスログテーブルのデータを変換します。これにより、ターゲットのユーザーペルソナデータが生成されます。
データ変換から生成されたテーブルに対して、データ品質の監視ルールを設定します。これにより、ダーティデータを早期に検出してブロックし、下流のデータに影響が及ぶのを防ぐことができます。
ユーザーペルソナ分析タスクフローが完了すると、対応するデータテーブルが MaxCompute に作成されます。これらのテーブルは、データマップモジュールで表示できます。また、データリネージを使用してテーブル間の関係を表示することもできます。
データを消費する
ユーザーペルソナ分析が完了したら、データ分析モジュールを使用して、処理済みデータの データ可視化 を作成します。これにより、主要な情報をすばやくフェッチし、データの背後にあるビジネスの傾向を把握できます。
最終的に処理されたデータを取得した後、DataService Studio モジュールを使用して、標準化された API データサービス インターフェイスを介してデータを共有および適用し、API を介してデータを受け入れる他のビジネスモジュールにデータを提供できます。