データソースは、MaxCompute、MySQL、OSS などのさまざまなデータベースおよびストレージサービスに接続します。これは、Data Integration 同期タスクを実行するための前提条件であり、タスクが読み取るデータベース(ソース)および書き込むデータベース(送信先)を定義します。
データソースの役割
Data Integration タスクにおいて、データソースはデータフローの両端で エンドポイントとして機能します:
ソース(リーダー):タスクは、ソースとして構成されたデータソースからデータを読み取ります。
送信先(ライター):タスクは、処理済みのデータを 送信先として構成されたデータソースに書き込みます。
単一テーブルまたは完全データベースの同期(バッチモードまたはリアルタイムモード)を実行するには、必ずソースおよび送信先のデータソースを両方構成する必要があります。また、タスクが正常に実行されるためには、ネットワーク接続が適切に確立された状態で正しく構成されたデータソースが必要です。
サポートされるデータソースの種類
DataWorks Data Integration でサポートされるデータソースの一覧については、「サポートされるデータソースと同期ソリューション」をご参照ください。データソースの種類によって構成手順が若干異なる場合があります。詳細については、UI 上の表示をご確認ください。
データソースの作成
データソースは、管理センターまたは Data Integration のいずれかで作成できます。以下の表に、それぞれの方法を比較します。
機能 | 管理センター(推奨) | Data Integration |
管理場所 | 。 | 。 |
開発環境および本番環境向けに個別の構成をサポートし、本番データを保護します。 | サポートされません。本番環境のみ利用可能です。 | |
マルチモジュールでの再利用性 | Data Integration、DataStudio、Data Analysis を含むすべてのモジュールで使用できます。 | 他のモジュールで使用する際の機能が制限されます。 |
権限制御 | ワークスペース間の権限付与をサポートします。 | 権限付与をサポートしません。 |
適用可能なモード | 標準モードのワークスペースに推奨。エンタープライズ基準に準拠します。 | 基本モード、または隔離を必要としない標準モードのシナリオに適しています。 |
複製機能 | 新しいデータソースを迅速に作成するために複製をサポートします。 | サポートされません。 |
どちらの方法でも、サードパーティ認証およびRAM ロールによるデータソースの構成がサポートされます。
データソースの作成手順は、どちらの場所でも同一です。
管理センターでデータソースを作成すると、Data Integration 内にも同名のデータソースが自動的に作成されます。両者は同じ 本番環境 構成を共有します。
Data Integration でデータソースを作成すると、管理センター内にも同名のデータソースが自動的に作成されます。ただし、このデータソースには 本番環境 の情報のみが含まれており、開発環境 の構成は手動で行う必要があります(未完了状態としてマークされます)。
構成パラメーターはデータソースの種類によって異なります。詳細については、「データソース一覧」をご参照ください。
データソースの使用方法
基本モード:
基本モードのワークスペースでは、環境は 1 つだけ存在します。そのため、管理センターおよび Data Integration で作成したデータソースは同一です。
標準モード:
標準モードのワークスペースでは、データソースの環境隔離がサポートされます。1 つのデータソース名に対して、開発環境用と 本番環境用の 2 つの個別の構成を設定できます。これにより、テストデータと本番データを分離するために、それぞれ異なるデータベースやインスタンスを指定することが可能です。この隔離により、本番データが保護されます。
Data Integration では、単一テーブルのバッチ同期タスクのみがデータソースの環境隔離をサポートします。その他のすべての 同期タスク は本番環境のデータソースを使用します。
Data Integration で作成したデータソースには本番環境の構成のみが含まれています。開発環境の情報が欠落しているため、データ開発タスクでは直接使用できません。DataStudio または単一テーブルのバッチ同期タスクで使用する前に、管理センターで開発環境の構成を完了する必要があります。
次のステップ
データソースの構成を完了し、接続性テストに合格した後、Data Integration で同期タスクを構成できます:
単一テーブルのバッチ同期:「コードレス UI を使用した構成」または「コードエディタを使用した構成」。
単一テーブルのリアルタイム同期:「単一テーブルのリアルタイム同期タスクの構成」。
完全データベースのバッチ同期:「完全データベースのバッチ同期タスクの構成」。
完全データベースのリアルタイム同期:「完全データベースのリアルタイム同期タスクの構成」。
完全データベースの完全・増分同期:「完全データベースの完全・増分同期タスクの構成」。
よくある質問
データソースの使用に関するその他の一般的な質問については、「Data Integration よくある質問」をご参照ください。