Data Transmission Service (DTS) の抽出・変換・書き出し(ETL)機能により、カスタムパイプライン基盤を記述することなく、リアルタイムのストリーム処理パイプラインを構築できます。この機能は、DTS のデータレプリケーションと統合されており、ソースデータベースからの抽出、変換ロジックの適用、および送信先システムへの書き出しを、単一のタスクで実行します。ETL を活用することで、処理効率が向上し、開発のハードルが低減され、業務システムへの影響も軽減されます。
ETL タスクでは、以下の 2 種類の作成モードをサポートしています:
DAG モード — 入力/ディメンションテーブル、変換、出力の 3 つのビルトインコンポーネントを備えたドラッグアンドドロップ方式のキャンバス。
Flink SQL モード — Flink SQL ステートメントを直接記述するモード。標準 SQL 構文と互換があります。
各モードの使用タイミング
| DAG モード | Flink SQL モード | |
|---|---|---|
| 推奨される用途 | ビジュアルによるパイプライン構築を好むチーム、または SQL の記述を避けたいチーム | SQL に慣れたチームで、カスタムロジックが必要な場合 |
| 作成方法 | コンポーネントをドラッグアンドドロップ | Flink SQL ステートメントを記述 |
| 変換の柔軟性 | 90 以上のビルトイン関数による計算シナリオに対応 | フル機能の Flink SQL 構文による表現が可能 |
対応データベース
| コンポーネント | 対応データベース |
|---|---|
| 入力/ディメンションテーブル(ソース) | セルフマネージド MySQL、ApsaraDB RDS for MySQL、PolarDB for MySQL、PolarDB-X 1.0(旧称:DRDS)、セルフマネージド Oracle、セルフマネージド PostgreSQL、ApsaraDB RDS for PostgreSQL、Db2 for LUW、Db2 for i、PolarDB for PostgreSQL |
| 出力(送信先) | セルフマネージド MySQL、ApsaraDB RDS for MySQL、PolarDB for MySQL、AnalyticDB for MySQL V3.0、セルフマネージド Oracle、セルフマネージド PostgreSQL、ApsaraDB RDS for PostgreSQL、Db2 for LUW、Db2 for i、PolarDB for PostgreSQL |
変換機能
「変換」コンポーネントでは、以下の 3 種類の操作をサポートしています:
| 操作 | 説明 |
|---|---|
| 参加 | 複数のソーステーブルまたはディメンションテーブルから行を結合 |
| Function compute | 90 以上のビルトイン計算シナリオを活用した変換処理 |
| フィルター | 送信先への書き出し前に、フィールドを選択または除外 |
主なメリット
業界トップクラスの処理効率 — ETL 機能は DTS のデータ収集機能と統合されており、データ精度を確保するとともに、業界トップクラスの処理効率を実現します。
柔軟なタスク監視および管理 — DTS コンソールから ETL タスクを直接監視および管理できます。タスクの開始、停止、詳細情報の表示が可能です。
ユースケース
異種ソースからのデータ統合 — 異なる種類や異なるリージョンにあるデータベースからリアルタイムでデータをプルし、単一の送信先へ統合することで、集約レポートおよび集中運用を実現します。
ローコードによるデータ統合 — カスタムコードではなくビジュアルインターフェイスを用いてデータ統合パイプラインを構築し、開発期間および運用の複雑さを削減します。
リアルタイムデータウェアハウス — イベント発生時に前処理済みのデータをデータウェアハウスへストリーミングし、スケジュールされたバッチ処理を待つ必要をなくします。
オフラインデータウェアハウスの高速化 — データウェアハウスに到達する前にストリーミングデータを前処理します。これにより、生データの取り込みによる影響を受けずにクエリ処理を提供できます。
リアルタイムレポート — 常時更新されるデータストリームを元にダッシュボードおよびレポートシステムを駆動し、運用モニタリングやビジネスアナリティクスなどのシナリオに適しています。
リアルタイムコンピューティング — ストリーミングデータをクリーニングおよびエンリッチメント処理し、特徴量およびタグを抽出します。代表的な利用例として、ユーザー・プロファイリング、リスク管理、レコメンデーションシステムが挙げられます。
課金
ETL 機能は現在パブリックプレビュー中です。プレビュー期間中は、各アカウントで最大 2 つの ETL インスタンスを無料で作成できます。
パブリックプレビュー終了後は、実行中のインスタンスに対して課金が発生します。Alibaba Cloud では、事前に公告および SMS にてユーザーに通知いたします。