すべてのプロダクト
Search
ドキュメントセンター

DataWorks:API ベースのデータクエリの高速化ソリューション

最終更新日:Jan 11, 2025

DataService Studio では、特定の raw データテーブルのクエリを高速化するための高速化ソリューションを設定できます。高速化ソリューションには、DataService Studio が提供する高速化サービスと、MaxCompute が提供する MCQA が含まれます。API のクエリパフォーマンスと効率を向上させるために、API の高速化ソリューションを設定できます。このトピックでは、サポートされている高速化ソリューションと、API の高速化ソリューションを設定する方法について説明します。

背景情報

DataService Studio は、次の高速化ソリューションを提供します。[高速化サービス][MCQA]。相談するには、DataWorks DingTalkグループに参加 できます。

次の表に、2 つの高速化ソリューションを示します。

高速化ソリューション

説明

サポートされているリージョンとリソースグループ

設定

[高速化サービス]

この高速化ソリューションは、Hologres 外部テーブルに基づいて実装されています。このソリューションにより、Hologres は Hologres 外部テーブルのスキーマと MaxCompute テーブルのスキーマ間のマッピングを確立できます。MaxCompute からデータをエクスポートする必要はありません。これにより、MaxCompute データのクエリが高速化されます。

説明

このソリューションを使用する場合、既存の Hologres コンピューティングエンジンインスタンスが自動的に使用されるため、Hologres コンピューティングエンジンインスタンスを購入する必要はありません。高速化を有効にする MaxCompute テーブルを指定するだけで済みます。

  • この高速化ソリューションは、中国 (上海)、中国 (北京)、中国 (杭州)、中国 (深セン) リージョンでサポートされています。

  • 2023 年 3 月 1 日から、DataService Studio の共有リソースグループを使用して DataService Studio API を呼び出す場合、この高速化ソリューションの使用に対して課金されます。DataService Studio の共有リソースグループの請求については、DataService Studio をご参照ください。

  • このソリューションを使用して、MaxCompute データに対してのみ高速クエリを実行できます。

高速化ソリューションを使用する前に、次の操作を実行する必要があります。

  1. 高速化項目を追加する

  2. API を設定する

詳細については、高速化サービスソリューションを使用する をご参照ください。

[MCQA]

この高速化ソリューションは、MaxCompute Query Acceleration (MCQA) 機能に基づいて実装されています。このソリューションを使用して、小規模および中規模のクエリジョブの実行を高速化し、実行時間を数分から数秒に短縮できます。詳細については、MCQA の概要 をご参照ください。

  • この高速化ソリューションは、中国 (北京)、中国 (杭州)、中国 (上海)、中国 (深セン) リージョンでサポートされています。ソリューションの更新は完了しています。

  • DataService Studio の専用リソースグループのみがこの高速化ソリューションをサポートしています。

  • この高速化ソリューションは、サブスクリプション MaxCompute プロジェクトと従量課金制 MaxCompute プロジェクトで利用できます。

高速化ソリューションを使用するには、API を設定するときに、[高速化方法] パラメーターで [MCQA] を選択するだけで済みます。詳細については、MCQA ソリューションを使用する をご参照ください。

高速化サービスソリューションを使用する

注意事項

  • 高速化項目には 1 つのデータテーブルのみを含めることができ、データテーブルには 1 つの高速化項目のみを追加できます。

  • 高速化項目を追加するときに、高速化項目が既に追加されているデータテーブルの名前を選択すると、高速化項目の初期化に失敗します。

手順 1:高速化項目を追加する

  1. [dataservice Studio] ページに移動します。

    DataWorks コンソール にログオンします。上部のナビゲーションバーで、目的のリージョンを選択します。左側のナビゲーションペインで、[データ開発とガバナンス] > DataService Studio を選択します。表示されたページで、ドロップダウンリストから目的のワークスペースを選択し、[dataservice Studio に移動] をクリックします。

  2. 左側のナビゲーションペインで、数据加速 アイコンをクリックして [高速化サービス] ページに移動します。

  3. [高速化サービス] ページの右上隅にある [高速化項目の追加] をクリックします。

  4. [高速化項目の追加] ダイアログボックスで、パラメーターを設定します。次の表に、パラメーターを示します。

    新增

    パラメーター

    説明

    [高速化ソリューション]

    [hologres 外部テーブル] を選択します。

    説明

    Hologres は、Alibaba Cloud によって開発されたリアルタイムデータウェアハウスサービスであり、基盤となるレイヤーで MaxCompute に接続されています。高速化サービスソリューションは、Hologres 外部テーブルに基づいて実装されています。このソリューションにより、Hologres は Hologres 外部テーブルのスキーマと MaxCompute テーブルのスキーマ間のマッピングを確立できます。MaxCompute からデータをエクスポートする必要はありません。これにより、MaxCompute データのクエリが高速化されます。このソリューションを使用する場合、既存の Hologres コンピューティングエンジンインスタンスが自動的に使用されるため、Hologres コンピューティングエンジンインスタンスを購入する必要はありません。高速化を有効にする MaxCompute テーブルを指定するだけで済みます。

    [データソースタイプ]

    MaxCompute (ODPS) を選択します。

    [テーブル名]

    MaxCompute データソースとデータテーブルの名前を選択します。

    説明

    複数のデータテーブルのクエリを高速化するには、[テーブルの追加] をクリックしてデータテーブルを追加します。このようにして、複数の高速化項目を一度に追加できます。一度に最大 10 個の MaxCompute データテーブルを追加できます。

  5. [OK] をクリックします。[初期化に成功しました][アクセラレーション項目の追加] ダイアログボックスの [ステータス] 列に表示されたら、[閉じる] をクリックします。

手順 2:API を設定する

目的の API を見つけ、API の名前をダブルクリックします。API の設定タブの [テーブルの選択] セクションで、[データソースタイプ]、[データソース名]、[高速化方法]、[テーブル名] パラメーターを設定します。选择表

  • [データソースタイプ]:MaxCompute (ODPS) を選択します。

  • [データソース名]:高速化項目が追加されているデータソースの名前を選択します。

  • [高速化方法][高速化サービス] を選択します。

    説明
    • [高速化方法] パラメーターを [高速化サービス] に設定すると、高速化サービスソリューションを使用して、API を使用して実行されるデータクエリが高速化されます。[高速化サービス] ページで、API に関連付けられている高速化項目を表示できます。

    • コードエディターを使用して API を作成した場合、この API を使用して単一テーブルクエリのみを実行でき、コードエディターで Hologres 構文を使用する必要があります。

  • [テーブル名]:高速化項目が追加されているデータテーブルには、[高速化済み] のマークが付いています。ドロップダウンリストから、高速化項目が追加されているデータテーブルを選択できます。

その他のパラメーターの設定方法の詳細については、コードレス UI を使用して API を作成する または コードエディターを使用して API を作成する をご参照ください。

手順 3:高速化項目を表示する

DataService Studio の [高速化サービス] ページで、追加した高速化済み項目を表示できます。数据加速

列名

説明

[アクション]

サポートされている操作:[破棄][API の表示]

  • [破棄]:[破棄] をクリックして、高速化項目を破棄できます。高速化項目を破棄した後、高速化項目に関連付けられている API を呼び出すとエラーが発生します。

    説明

    高速化項目を破棄する前に、高速化項目に関連付けられている API を確認し、API の公開を取り消すことをお勧めします。

  • [API の表示]:[その他] アイコンをクリックし、[API の表示] を選択して、関連する高速化項目に関連付けられている API を表示できます。

MCQA ソリューションを使用する

MCQA 高速化ソリューションを使用するには、API を設定するだけで済みます。

API を設定する

目的の API を見つけ、API の名前をダブルクリックします。API の設定タブの [テーブルの選択] セクションで、[データソースタイプ]、[データソース名]、[高速化方法]、[テーブル名] パラメーターを設定します。MCQA

  • [データソースタイプ]:MaxCompute (ODPS) を選択します。

  • [データソース名]:高速化項目が追加されているデータソースの名前を選択します。

  • [高速化方法][MCQA] を選択します。

    説明

    [高速化方法] パラメーターを [MCQA] に設定すると、MCQA ソリューションを使用して、API を使用して実行されるデータクエリが高速化されます。

  • [テーブル名]:目的の MaxCompute データテーブルの名前を選択します。

その他のパラメーターの設定方法の詳細については、コードレス UI を使用して API を作成する または コードエディターを使用して API を作成する をご参照ください。