すべてのプロダクト
Search
ドキュメントセンター

DataWorks:旧バージョンの DataStudio を使用する

最終更新日:Nov 09, 2025

このチュートリアルでは、DataWorks と StarRocks のプロダクトポートフォリオを使用して、ビッグデータの開発と分析を行う方法を説明します。ユーザープロファイル分析のケーススタディを通じて、DataWorks のデータ統合、データ開発、およびオペレーションセンターモジュールの機能について説明します。

ケーススタディの紹介

このケーススタディでは、Web サイトでのユーザーの動作から基本的なプロファイルデータを取得して、ビジネス戦略を改善する方法を説明します。このデータには地理的および社会的属性が含まれており、スケジュールされたプロファイル分析の実行に使用されます。この分析により、詳細な Web サイトトラフィックの操作が可能になります。DataWorks と EMR Serverless StarRocks のプロダクトポートフォリオを使用して、データ同期、データ変換、データ管理、およびデータ消費を実行できます。

説明

このチュートリアルを進めるには、「チュートリアルの目的と設計」を読んで、ユーザーペルソナ分析の全体的なフローを理解してください。

データ開発プラットフォーム

このチュートリアルでは、DataWorks の レガシーデータ開発 (DataStudio) プラットフォームを使用します。ワークスペースが [新しいデータ開発 (Data Studio) を使用] に設定されていないことを確認してください。

  • ワークスペースを作成する際は、[新しいデータ開発 (DataStudio) を使用] オプションを選択しないでください。

  • 2025 年 2 月 18 日以降、Alibaba Cloud アカウントを使用して DataWorks を有効にし、次のリージョンで初めてワークスペースを作成すると、新しいバージョンの Data Studio がデフォルトで有効になります。アカウントで新しいバージョンの Data Studio がすでにデフォルトで有効になっている場合は、「新しいバージョンの Data Studio を使用する」をご参照ください。

    中国 (杭州)、中国 (上海)、中国 (北京)、中国 (張家口)、中国 (ウランチャブ)、中国 (深圳)、中国 (成都)、中国 (香港)、日本 (東京)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、タイ (バンコク)、ドイツ (フランクフルト)、イギリス (ロンドン)、米国 (シリコンバレー)、米国 (バージニア)

手順

  1. 環境の準備

    このチュートリアルに必要な StarRocks インスタンスと DataWorks ワークスペースを作成し、関連するリソースグループのネットワーク構成を完了します。

  2. データの同期

    DataWorks でデータ同期チャネルを構成して、このチュートリアルで提供されるユーザー情報と Web サイトのログデータを StarRocks 計算リソースに同期します。その後、同期されたデータをクエリできます。

  3. データの変換

    DataWorks の StarRocks ノードを使用して、StarRocks に同期されたユーザー情報テーブルとアクセスログテーブルのデータを変換します。このプロセスにより、ターゲットのユーザープロファイルデータが生成されます。

  4. データ品質の監視

    データ変換から生成されたテーブルに対してデータ品質監視ルールを構成します。これにより、ダーティデータを事前に検出してブロックし、その影響が広がるのを防ぐことができます。

  5. データの管理

    ユーザープロファイル分析タスクのワークフローが完了すると、対応するデータテーブルが StarRocks に作成されます。生成されたデータテーブルとそのリネージは、データマップモジュールで表示できます。

  6. データの消費

    • ユーザープロファイル分析が完了したら、DataAnalysis モジュールを使用して変換されたデータを視覚化します。これにより、主要な情報を迅速に抽出し、ビジネスの傾向に関するインサイトを得ることができます。

    • 最終的に変換されたデータを取得した後、DataService Studio モジュールを使用して、標準の API ベースのデータサービスを介してデータを共有および適用します。これにより、API を使用する他のビジネスモジュールにデータが提供されます。