Explanation of key concepts and terminology - DataWorks

このトピックでは、DataWorks のモジュール（Data Integration、Data Modeling、Data Development、Data Analysis、Data Service）における基本的な概念について説明します。

このトピックでは、DataWorks の各モジュール（Data Integration、Data Modeling、DataStudio、DataAnalysis、DataService Studio）で使用されるデータ開発関連の用語について説明します。

一般的な用語

ワークスペース

ワークスペースは、DataWorks におけるタスク、メンバー、ロール、および権限を管理する基本単位です。ワークスペース管理者は、ユーザーを追加し、以下のロールのいずれかを割り当てることができます：ワークスペース管理者、開発者、O&M（運用・保守）、デプロイ、セキュリティ管理者、またはビジター。異なるロールを持つメンバーは、ワークスペース内で協業できます。

リソースを分離するために、部署または業務部門ごとにワークスペースを作成してください。

リソースグループ

リソースグループは、DataWorks の機能ごとに計算リソースを提供する DataWorks サービスです。DataWorks を使用してデータ開発操作を実行するには、事前にリソースグループを準備する必要があります。リソースグループのステータスは、関連する機能の実行状態に影響を与え、そのクォータはタスクおよびサービスの効率に影響します。

DataWorks のリソースグループは、Alibaba Cloud アカウント内のリソースグループとは異なります。後者はアカウントのリソースと権限を管理するものであり、DataWorks のリソースグループはタスクの実行に使用されます。

主な詳細情報：

特に断りのない限り、DataWorks のリソースグループは、旧バージョンのリソースグループではなく、サーバーレスリソースグループを指します。サーバーレスリソースグループは汎用目的で使用されます。
サーバーレスリソースグループは、データ同期、データスケジューリング、および DataService Studio で利用できます。

基本モードと標準モード

DataWorks では、異なるセキュリティ制御要件に対応するため、基本モードと標準モードの 2 種類のワークスペースモードが提供されています。標準モードでは、データソースを追加すると、開発環境と本番環境向けにそれぞれ独立したデータソースが作成され、相互に分離されます。

計算リソース

計算リソースとは、コンピュートエンジンがデータ処理および分析タスクを実行するために使用するリソースインスタンスです。例として、クォータグループが設定された MaxCompute プロジェクトや Hologres インスタンスがあります。

ワークスペースに複数の計算リソースを関連付けることで、それらのリソースを利用するタスクの開発およびスケジューリングが可能になります。

Data Integration

データソース

データソースは、DataWorks を外部データストレージサービスに接続するものです。同期タスクを設定する前に、DataWorks 内で使用するデータソースに関する情報を定義する必要があります。同期タスクを設定する際には、データソース名を選択することで、読み取り元のデータベースおよび書き込み先のデータベースを指定できます。ワークスペースには、複数種類のデータソースを追加できます。

データ同期

Data Integration のデータ同期機能は、ストレージシステム間でデータを移動します。構造化データ（ApsaraDB RDS や PolarDB-X 1.0 など）、半構造化データ、非構造化データ（Object Storage Service (OSS) やテキストファイルなど）をサポートしています。Data Integration では、2 次元の論理テーブルとして抽象化可能なデータのみを同期できます。OSS 内の MP3 ファイルなど、完全な非構造化データはサポートされていません。

サポートされる同期方法は以下のとおりです：

バッチ同期
リアルタイム同期
単一テーブルまたは全体のデータベースに対する全量および増分同期

Data Integration では、リソースグループの構成を必要としないサーバーレス同期タスクもサポートしています。

Data Modeling

データモデリング

企業の業務が急速に発展するにつれ、業務データの量は指数関数的に増加し、データの複雑さが高まり、さまざまな不整合なデータ基準が現れるようになりました。これにより、データ管理の難易度が大幅に高まっています。データモデリングは、企業が複雑で無秩序な大量のデータを構造化・管理し、より多くの業務価値を抽出することを支援します。

リバースモデリング

リバースモデリングは、既存の物理テーブルからデータモデルを自動生成する手法であり、ディメンショナルモデリングにおいてテーブルを手動で作成する必要をなくします。これにより、モデル作成に必要な時間を短縮できます。

モデリングワークスペース

データシステムが複数のワークスペースにまたがっており、すべてのワークスペースで統一されたデータウェアハウス計画を適用したい場合は、モデリングワークスペース機能をご利用ください。この機能では、ワークスペース間でデータモデリングツールを共有し、統一されたデータウェアハウス計画、ディメンショナルモデリング、およびメトリクス定義を実現できます。

ディメンションテーブル

ディメンションテーブルは、分析目的でデータドメインから抽出されたディメンションおよびその属性を格納します。たとえば、EC 分析では、注文、ユーザー、商品などが代表的なディメンションであり、それぞれに固有の属性（注文ディメンションの注文 ID や作成時刻、商品ディメンションの商品 ID や名称など）があります。各ディメンションの属性は、ディメンションテーブルのフィールドとなります。

ファクトテーブル

ファクトテーブルは、ビジネス活動によって実際に生成されたデータを格納します。たとえば、注文処理のファクトテーブルには、注文 ID、注文作成時刻、商品 ID、商品数量、売上金額などのフィールドが含まれる場合があります。ETL 処理によってファクトテーブルが更新され、ビジネスチームがダウンストリームのデータ分析のためにクエリを実行できるようになります。

集計テーブル

集計テーブルは、データドメイン内で同一の統計期間およびディメンションを共有する複数の派生メトリクスの統計データを格納します。集計テーブルは、生データのビジネス抽象化から導出され、ビジネスクエリ、オンライン分析処理（OLAP）分析、およびデータ分散の基盤となります。

アプリケーションテーブル

アプリケーションテーブルは、同一の統計期間、ディメンション、および統計粒度を共有するアトミックメトリクスおよび派生メトリクスによって収集された統計データを整理します。この構造は、特定のアプリケーションシナリオにおける効率的なビジネスクエリ、OLAP 分析、およびデータ分散を支援します。

データマート

データマートは、特定の業務カテゴリまたはシナリオに範囲を限定したデータ組織です。データマートは通常、アプリケーション層に属し、共通層からの集計データに依存します。

データウェアハウス計画

DataWorks コンソールのデータウェアハウス計画ページでは、データウェアハウスアーキテクトおよびモデルグループのメンバーがデータウェアハウスの構造を設計します。このページから、データレイヤー、業務カテゴリ、データドメイン、ビジネスプロセス、データマート、および主題領域を定義できます。モデル設計者は、これらの構造オブジェクトに基づいてモデルを管理します。

DataWorks では、以下のデータウェアハウスレイヤーがサポートされています：

データインポートレイヤー：データベースレコード、ログ、メッセージなどの基本的な生データを格納します。生データは、ETL 処理を経てこのレイヤーに到達します。このレイヤーには、オペレーショナルデータストア（ODS）テーブルのみを格納できます。
共通レイヤー：データインポートレイヤーから取得したデータを処理・集計し、再利用可能なファクトデータおよび集計データを生成します。共通レイヤーでは、統一されたメトリクスディメンションを定義し、データ分析および収集のための再利用可能なファクトデータおよび集計データを作成できます。ファクトテーブル、ディメンションテーブル、および集計テーブルを格納します。
アプリケーションレイヤー：共通レイヤーで処理されたデータを、特定の製品またはアプリケーションシナリオに範囲を限定して格納します。アプリケーションテーブルおよびディメンションテーブルを格納します。

データレイヤー

デフォルトでは、DataWorks のデータウェアハウスは 5 つのレイヤーに分割されます：

ODS（オペレーショナルデータストア）：ソースと同一のテーブル構造で生データを受信・格納します。データウェアハウスのステージングエリアとして機能します。
DWD（データウェアハウスの詳細）：個別のビジネス活動に基づいてデータモデルを構築します。最高粒度のファクトテーブルを作成し、ファクトテーブルとディメンションテーブル間の結合を減らすワイドテーブルをサポートします。
DWS（データウェアハウスサービス）：特定の分析対象オブジェクトに基づいてデータモデルを構築します。上位レイヤーのアプリケーションおよび製品向けに汎用的な集計テーブルを作成します。
ADS（アプリケーションデータサービス）：製品固有のメトリクスデータを格納し、さまざまなレポートを生成します。
DIM（ディメンション）：ディメンションに基づいてデータモデルを構築します。論理ディメンションテーブルおよび概念的ディメンションを格納し、プライマリキーおよびディメンション属性を定義し、ディメンションテーブルのための異なるディメンションを関連付けます。これにより、データ分析における整合性が確保され、データ計算仕様およびアルゴリズムの不整合によるリスクが軽減されます。

詳細については、「データウェアハウスのレイヤリング」をご参照ください。

主題領域

主題領域は、データマート内のデータを複数の分析視点から分類するために使用される業務主題の集合です。たとえば、EC データは取引主題領域、会員主題領域、商品主題領域に整理できます。

データドメイン

データドメインは、同種のデータをグループ化します。分類基準はデータの用途によって異なります。たとえば、EC データは取引データドメイン、会員データドメイン、商品データドメインに分割されることがあります。データドメインにより、関連データを迅速に特定できます。

ビジネスプロセス

ビジネスプロセスは、特定のデータドメイン内で企業が実行するビジネス活動であり、Data Modeling における分析の主要な論理主題です。たとえば、取引データドメインには、カートへの商品追加、注文処理、支払い処理などのビジネスプロセスが含まれる場合があります。

複合メトリクス

複合メトリクスは、特定の派生メトリクスおよびカスタム計算ルールから算出されます。派生メトリクスは定義済みのタイムウィンドウ内で統計を収集しますが、週次成長率などの相対的な測定値を算出することはできません。複合メトリクスはこのギャップを埋め、成長率や値の差分などの詳細な統計分析を可能にします。

データメトリクス

Data Modeling のメトリクスシステムは、メトリクスの定義および管理のための統一フレームワークを提供します。これは、以下の 4 つの構成要素から成ります：

アトミックメトリクス：ビジネスプロセスに関連付けられた単一の測定値です。たとえば、注文処理プロセスにおける「支払金額」です。
修飾子：統計範囲を狭めるフィルターです。たとえば、「マタニティ＆ベビー製品」は、支払金額メトリクスを特定の製品カテゴリに限定します。
期間：データ収集のための時間範囲または時点です。たとえば、「過去 7 日間」です。
派生メトリクス：アトミックメトリクス、期間、および 1 つ以上の修飾子の組み合わせです。たとえば、「過去 7 日間におけるマタニティ＆ベビー製品の支払金額」です。

ルックアップテーブル

ルックアップテーブルは、フィールド標準によって管理されるフィールドの有効値範囲を定義します。たとえば、性別フィールド標準のルックアップテーブルには、「male」と「female」の値が含まれる場合があります。

フィールド標準

フィールド標準は、意味が同じだがテーブル間で異なる名称で出現するフィールドを一元管理します。また、これらのフィールドの値範囲および測定単位を定義します。フィールド標準が変更された場合、DataWorks は影響を受けるすべてのテーブルを迅速に特定でき、データ整合性および精度の向上を支援します。

DataStudio

ノード

DataStudio を使用すると、データ処理の異なる段階に対応するさまざまなタイプのノードを作成できます：

データ同期ノード：ソースと送信先間でデータを移動します。
コンピュートエンジンノード：データ変換ロジックを実行します。例として、ODPS SQL ノード、Hologres SQL ノード、EMR Hive ノードがあります。
汎用ノード：コンピュートエンジンロジックを調整または拡張します。例として、ノードのグループ管理を行うゼロロードノードや、ノードコードをループ処理する do-while ノードがあります。

ノードタイプを組み合わせることで、特定のデータ処理要件を満たせます。

自動トリガーワークフロー

自動トリガーワークフローは、ビジネス観点から見たビジュアル有向非循環グラフ（DAG）インターフェイスを提供する開発モードです。キャンバス上にさまざまなノードタイプをドラッグ＆ドロップすることで、タスク間の依存関係を視覚的に設定できます。これにより、データ処理が促進され、タスク開発効率が向上し、複雑なプロジェクト管理が簡素化されます。

ノートブック

ノートブック機能は、SQL コード、Python コード、テキスト、実行結果、およびデータビジュアライゼーション（大画面表示）チャートを 1 つのインターフェイスに統合したインタラクティブな環境を提供します。ノートブックは、データ探索、データ分析、AI モデル開発に使用します。

SQL スクリプトテンプレート

SQL スクリプトテンプレートは、SQL スクリプトから抽象化された再利用可能な論理ブロックです。SQL スクリプトテンプレートは、MaxCompute タスクにのみ適用されます。

各テンプレートには、1 つ以上のソーステーブルが関与します。これらのテーブルをフィルター処理、結合、集計して、結果テーブルを生成できます。テンプレートは入力および出力パラメーターを受け入れるため、さまざまなビジネスシナリオに適応できます。

スケジューリング依存関係

スケジューリング依存関係は、タスク間の実行順序を定義します。ノード B がノード A の完了後にのみ実行できる場合、ノード A はノード B の先祖となります。DAG では、矢印がこれらの依存関係を表します。

データタイムスタンプ

データタイムスタンプは、ビジネス活動と直接関係のある日付であり、ビジネスデータが実際に生成された時刻を反映します。この概念は、オフラインコンピューティングのシナリオで重要です。

たとえば、小売タスクが 2024 年 10 月 10 日の売上高を計算する場合、タスクは 2024 年 10 月 11 日の早朝に実行されます。このタスクのデータタイムスタンプは、実際の実行日ではなく 20241010 です。

出力名

出力名は、タスクによって生成される出力を識別します。Alibaba Cloud アカウント内でタスク間の依存関係を設定する際には、タスク名または ID ではなく出力名を使用します。上流タスクの出力名は、下流タスクの入力名となります。

出力名は、ご利用の Alibaba Cloud アカウント内でグローバルに一意である必要があります。デフォルト形式は ワークスペース名.ランダムに生成された 9 桁の数字.out です。カスタム出力名を指定することもできますが、ご利用の Alibaba Cloud アカウント内で一意である必要があります。

出力テーブル名

出力テーブル名は、依存関係を設定する際に、子孫タスク内のデータが期待される先祖テーブルから来ていることを確認するための識別子です。タスクが生成するテーブルの名前を出力テーブル名として使用し、自動解析された出力テーブル名の変更は避けてください。

出力名はグローバルに一意である必要があります。出力テーブル名にはこのような要件はありません。これは単なる識別子です。出力テーブル名を変更しても、SQL ステートメントが実際に生成するテーブルの名前には影響しません。

スケジューリングパラメーター

スケジューリングパラメーターは、タスクコード内の変数であり、その値は実行時に動的に置き換えられます。タスクが実行されるたびに、現在の日付など、コンテキスト固有の情報を必要とする場合に、スケジューリングパラメーターを使用します。

データカタログ

データカタログは、データベース、テーブル、ファイルなど、組織内のすべてのデータ資産を構造化したマップです。DataWorks では、これらの資産のメタデータを記録します。

計算リソース、データソース、データカタログ間の関係

計算リソース、データソース、データカタログは、独立したオブジェクトですが、相互に関連しています。それらの関係は以下のとおりです：

ワークスペースに計算リソースを関連付けると、自動的にデータソースおよびデータカタログが生成されます。
ワークスペースにデータソースを追加すると、自動的にデータカタログが生成されます。
データカタログを作成しても、データソースまたは計算リソースは生成されません。

オペレーションセンター

スケジュール実行時刻

スケジュール実行時刻は、自動トリガータスクが実行される予定時刻であり、分単位の精度で指定されます。

重要

スケジュール実行時刻に達したからといって、タスクが即座に開始されるわけではありません。タスクが実行される前に、DataWorks は以下の 3 つの条件を検証します：先祖タスクが想定通りに完了していること、スケジュール実行時刻が到来していること、十分なリソースが利用可能であること。すべての条件が満たされた場合にのみ、タスクが実行されます。

データタイムスタンプ

データタイムスタンプは、ビジネス活動と直接関係のある日付であり、ビジネスデータが実際に生成された時刻を反映します。

たとえば、小売業界では、2024 年 10 月 10 日の売上高を計算する場合、計算処理は 2024 年 10 月 11 日の早朝に実行されます。このときのデータタイムスタンプは 20241010 です。

自動トリガータスク

定期タスクは、タスクの設定済みスケジュールプロパティに基づいてスケジューリングシステムによってトリガーされます。オペレーションセンターから、定期タスクに対して O&M および管理操作（DAG の表示、テスト実行、データバックフィル、タスク所有者の変更など）を実行できます。

自動トリガーインスタンス

定期インスタンスは、定期タスクのスケジュールプロパティに基づいて、タスクの実行タイミングごとに自動的に生成されます。たとえば、1 時間に 1 回実行されるように設定されたタスクは、1 日に 24 個のインスタンスを生成し、1 時間ごとに 1 つのインスタンスがトリガーされます。実行状態（実行中など）を持つのは、インスタンスのみです。オペレーションセンターから、インスタンスを停止、再実行、または手動で成功状態にマークできます。

データバックフィル

データバックフィル操作は、選択した時間範囲に基づいて、指定されたタスクのバックフィルインスタンスを生成します。データバックフィルは、既存データの書き戻しおよびデータ修正（過去期間のデータの再計算や、以前に生成されたデータの修正など）に使用します。

ベースライン

ベースラインは、一連のタスクに対するサービス品質の期待値を定義します。タスクをベースラインに関連付けると、DataWorks は優先度、コミット済み完了時刻、アラート余裕閾値の 3 つのプロパティに基づいて監視を行います。

優先度：数値が大きいほど優先度が高くなります。DataWorks は、優先度の高いベースラインにリソースを優先的に割り当てます。
コミット済み完了時刻：ベースライン内のタスクが出力を生成しなければならない締切時刻です。
アラート余裕閾値：コミット済み完了時刻から差し引かれる時間バッファーで、アラート時刻の算出に使用されます。DataWorks が、ベースライン内のタスクがアラート時刻までにデータを生成できないと検出した場合、設定済みの連絡先にアラートを送信します。

データガバナンスセンター

ヘルススコア

ヘルススコアは、テナント、ワークスペース、またはユーザーのガバナンス効果を反映する複合メトリクスです。スコアは 0 ～ 100 の範囲で、数値が高いほどデータ資産の状態が健全であることを示します。

DataWorks は、ヘルス評価モデルを使用してヘルススコアを算出し、ストレージ、コンピューティング、R&D、品質、セキュリティの 5 つの次元でガバナンス項目を評価します。各次元には特定のメトリクスが設定されており、ガバナンス上の課題がどこにあるかを明確に把握できます。

ガバナンス項目

ガバナンス項目は、DataWorks がデータ資産のガバナンス中に問題を検出するために使用するルールです。たとえば、R&D 規約違反、データ品質の問題、セキュリティコンプライアンスのギャップ、リソース利用率の低効率などが該当します。

ガバナンス項目は、必須項目と任意項目の 2 種類があります：

必須項目：デフォルトでグローバルに有効化されており、無効化できません。
任意項目：必要に応じて有効化できます。例として、タイムアウトするタスク、繰り返し失敗するノード、アクセスされないリーフノードの検出などがあります。

確認項目

確認項目は、タスクコードをコミットおよびデプロイする前に検証するアクティブなガバナンス機構です。確認項目が違反（全表スキャンやスケジューリング依存関係の欠如など）を検出した場合、DataWorks は確認イベントを生成し、コンテンツのデプロイをブロックします。

確認項目はガバナンス項目を補完します。ガバナンス項目は既存のデータ資産における問題を検出するのに対し、確認項目は非準拠のコードが本番環境に投入されるのを防止します。

データガバナンス計画

データ資産ガバナンスでは、データガバナンス計画テンプレートが、さまざまなシナリオ向けに提供されています。これらは、特定の期間内に予め定義されたガバナンス目標を達成することに焦点を当てています。データガバナンス計画テンプレートを使用すると、最も関連性の高いガバナンス項目および確認項目を迅速に特定し、最適化候補を特定し、定量的評価を通じてガバナンス目標への進捗を追跡できます。

ナレッジベース

ナレッジベースには、Data Governance Center のすべての組み込み確認項目およびガバナンス項目の定義、根本原因の説明、および是正措置のガイダンスが含まれています。これを活用して、問題を迅速に理解し、対応策を講じることができます。

セキュリティセンター

データ権限

セキュリティセンターは、最小権限の原則に基づく細かい権限要求、要求処理、権限監査をサポートします。また、権限要求をリアルタイムで追跡およびフォローすることも可能です。詳細については、「データアクセス制御」をご参照ください。

データセキュリティ

セキュリティセンターは、データ分類（カテゴリおよび感度レベル）、機密データの特定、データアクセス監査、データソースの追跡など、ワークフロー全体にわたるデータリスクの特定および管理のためのツールを提供します。詳細については、「概要」をご参照ください。

Data Quality

データ品質モニタリング

データ品質モニタリングは、パーティションテーブル内の特定のパーティションなど、データオブジェクトの状態を継続的に追跡し、あらかじめ定義された品質基準を満たしているかどうかを検証します。スケジュールイベントをトリガーして自動品質チェックを実行し、問題が検出された場合に指定された受信者にアラート通知を送信するよう設定できます。

モニタリングルール

「モニタリングルール」とは、データが品質要件を満たすかどうかを判断するための条件または論理的基準です。たとえば、「顧客の年齢は 0 未満であってはなりません」がモニタリングルールの例です。特定の範囲のデータに対してモニタリングルールを設定すると、DataWorks がそのルールに違反するデータを検出した際にアラートを送信します。

ルールテンプレート

ルールテンプレートは、事前定義された検証ロジックを備えた再利用可能な品質ルールです。ルールテンプレートをそのまま使用するか、しきい値を調整して、ご自身のデータ向けにモニタリングルールを作成できます。

DataWorks では、以下の 2 種類が提供されています：

組み込みルールテンプレート：DataWorks が提供するすぐに使用できるテンプレートです。詳細については、「組み込みルールテンプレート」をご参照ください。
カスタムルールテンプレート：カスタム SQL ステートメントを使用して独自のテンプレートを作成できます。特に、パーティションフィルター式で指定されたデータのモニタリングに適しています。頻繁に使用するカスタムルールをテンプレートとして保存し、再利用できます。詳細については、「カスタムルールテンプレート」をご参照ください。

データセキュリティガード

データカテゴリおよびデータ感度レベル

データカテゴリおよびデータ感度レベルを使用すると、データの価値、内容の秘密度、潜在的な影響、配布範囲に基づいてデータを分類できます。データ管理要件および開発制御は、感度レベルによって異なります。

機密データ特定ルール

機密データ特定ルールは、データのソースおよび用途に基づいてデータカテゴリを定義し、機密フィールドタイプを設定します。これにより、現在のワークスペース内の機密データを特定できます。DataWorks では組み込みの特定ルールが提供されており、必要に応じてカスタムルールを作成できます。

データマスキングルール

データマスキングルールは、特定された機密データのマスキング方法を指定します。マスキング動作は、データの感度レベルに応じて異なり、ビジネス制御要件を満たします。

リスク特定ルール

リスク特定ルールにより、データセキュリティガードは、インテリジェント分析を用いてデータに対するリスクのある操作を積極的に検出できます。リスクが特定された場合、システムはアラートを報告し、包括的なリスク管理を支援します。

データマップ

メタデータ

メタデータは、データ資産のプロパティおよび構造を記述します。以下を含みます：

データ属性：名称、サイズ、データの型
データ構造：フィールド名、型、長さ
その他の情報：場所、所有者、出力タスク、アクセス権限

データリネージ

データリネージは、データの作成から処理、同期、消費に至るまでの旅路をマッピングし、各段階で関与するすべてのデータオブジェクトを示します。DataWorks では、データリネージを視覚的に表示するため、問題の原因を簡単にトレースしたり、テーブルまたはフィールドの変更による影響を評価したりできます。

データアルバム

データアルバムは、業務カテゴリごとにテーブルを整理および管理します。特定のテーブルをデータアルバムに追加することで、検索および特定が容易になります。

データ分析

SQL クエリ

データ分析では、さまざまなデータソースタイプにわたるデータをクエリおよび分析するための標準 SQL ステートメントがサポートされています。詳細については、「SQL クエリ」をご参照ください。

ワークブック

ワークブックは、データの編集および管理のためのオンラインツールです。SQL クエリの結果またはローカルファイルをワークブックにインポートして、さらに分析および可視化を行えます。必要に応じて、ワークブックのデータをエクスポート、ダウンロード、または他のユーザーと共有できます。詳細については、「ワークブックの作成および管理」をご参照ください。

データインサイト

データインサイトは、人工知能（AI）技術を活用したデータ探索および可視化をサポートします。データ分布の理解、データカードの作成、およびそれらをデータレポートに統合するのに使用します。レポートは、長い画像として共有できます。AI 活用の分析により、複雑なデータをビジネス意思決定に役立てることができます。

DataService Studio

API

DataService Studio のAPI（Application Programming Interface）は、さまざまなタイプのデータソースに基づいて開発者が迅速にカプセル化するデータアクセスエンドポイントです。作成された API は、ビジネスアプリケーション、ソフトウェア、システム、レポート作成などのシナリオから呼び出して、データ取得および利用を容易にします。

関数

関数は、API の入力または出力のフィルターとして機能します：

プリフィルター：API 実行前に、着信リクエストパラメーターを処理します。たとえば、パラメーター値を変更したり、デフォルト値を割り当てたりします。
ポストフィルター：API の戻り結果を処理します。たとえば、レスポンスデータを再構成したり、追加コンテンツを付与したりします。

データプッシュ

データプッシュ機能では、宛先 Webhook URL にデータを定期的にプッシュするタスクを作成できます。単一テーブルまたは複数テーブルのクエリ用に SQL ステートメントを記述してプッシュするデータを定義し、出力をリッチテキストまたはテーブル形式でフォーマットできます。プッシュ頻度を制御するために、スケジュールプロパティを設定します。

Open Platform

OpenAPI

OpenAPI モジュールを使用すると、DataWorks の API オペレーションをプログラムで呼び出して、DataWorks の機能を利用したり、アプリケーションと DataWorks を統合したりできます。

OpenEvent

OpenEvent モジュールを使用すると、DataWorks の変更に関するイベント通知をサブスクライブできます。たとえば、テーブル変更イベントをサブスクライブして、コアテーブルの変更に関するリアルタイムアラートを受信したり、タスク変更イベントをサブスクライブして、リアルタイム同期タスクのステータスを監視するためのカスタムモニタリングダッシュボードを構築したりできます。

Extensions

Extensions モジュールは、OpenAPI および OpenEvent と連携して、カスタムロジックに基づいて DataWorks 内のユーザー操作を処理およびインターセプトするプラグインシステムです。たとえば、カスタムタスクデプロイ制御を実装する拡張機能を構築できます。