Dataphin で MaxCompute のデータを読み書きできるようにするために、MaxCompute データソースを作成します。このトピックでは、MaxCompute データソースの作成方法について説明します。
背景情報
MaxCompute は、Alibaba Cloud が提供するビッグデータコンピューティングサービスです。これは、データ分析シナリオ向けに Software as a Service (SaaS) として提供されるエンタープライズレベルのクラウドデータウェアハウスです。サーバーレスアーキテクチャを採用した、高速でフルマネージドのオンラインデータウェアハウスサービスを提供します。これにより、従来データプラットフォームが抱えていたリソースの拡張性や弾力性の制約が解消され、運用保守 (O&M) コストを最小限に抑えることができます。その結果、大量のデータをコスト効率よく、かつ効率的に分析・処理することが可能になります。
制限事項
MaxCompute データソースは、外部の MaxCompute プロジェクトへのアクセスをサポートしていません。詳細については、「MaxCompute プロジェクトの概要」をご参照ください。
権限の説明
スーパー管理者、データソース管理者、ドメインアーキテクト、プロジェクト管理者、およびデータソース作成権限を持つカスタムグローバルロールのみがデータソースを作成できます。
操作手順
Dataphin のホームページの上部のメニューバーで、[管理ハブ] > [データソース管理] をクリックします。
[データソース] ページで、[+データソースの作成] をクリックします。
[データソースの作成] ページの [ビッグデータストレージ] セクションで、[MaxCompute] を選択します。
最近 MaxCompute を使用したことがある場合は、[最近使用したもの] セクションから MaxCompute を選択することもできます。また、検索ボックスに「MaxCompute」と入力してクイック検索することも可能です。
[MaxCompute データソースの作成] ページで、接続パラメーターを構成します。
データソースの基本情報を構成します。
パラメーター
説明
データソース名
データソースの名前を入力します。名前は次の要件を満たす必要があります:
中国語文字、大文字と小文字、数字、アンダースコア (_)、ハイフン (-) のみを含めることができます。
最大長は 64 文字です。
データソースコード
データソースコードを構成すると、Flink_SQL タスク内または Dataphin Java Database Connectivity (JDBC) クライアントを使用して、Dataphin データソーステーブルに直接アクセスできます。クイックアクセスには、
data_source_code.table_nameまたはdata_source_code.schema.table_nameのフォーマットを使用します。タスクの実行環境に基づいてデータソースを自動的に切り替えるには、変数フォーマット${data_source_code}.tableまたは${data_source_code}.schema.tableを使用します。詳細については、「Dataphin データソーステーブルの開発」をご参照ください。重要データソースコードは、一度構成すると変更できません。
データソースコードが構成された後でのみ、アセットディレクトリおよびアセットチェックリストのオブジェクト詳細ページでデータをプレビューできます。
Flink SQL では、現在、MySQL、Hologres、MaxCompute、Oracle、StarRocks、Hive、SelectDB、および GaussDB データウェアハウスサービス (DWS) のデータソースのみがサポートされています。
データソースの説明
データソースの簡単な説明を入力します。説明は 128 文字を超えることはできません。
データソース構成
構成するデータソースを選択します:
ビジネスデータソースが本番データソースと開発データソースを区別する場合は、[本番 + 開発データソース] を選択します。
ビジネスデータソースが本番データソースと開発データソースを区別しない場合は、[本番データソース] を選択します。
タグ
タグに基づいてデータソースを分類し、タグ付けすることができます。タグの作成方法については、「データソースタグの管理」をご参照ください。
データソースと Dataphin 間の接続パラメーターを構成します。
[本番 + 開発データソース] を選択した場合は、[本番および開発データソース] の接続情報を構成します。[本番データソース] を選択した場合は、[本番データソース] のみの接続情報を構成します。
説明通常、開発環境と本番環境を分離するために、本番データソースと開発データソースは別々に構成されます。これにより、開発作業が本番データソースに影響を与えるのを防ぎます。ただし、Dataphin では、これらを同じデータソースとして同一のパラメーター値で構成することもサポートしています。
パラメーター
説明
エンドポイント
MaxCompute のエンドポイントです。ネットワーク環境と接続方式に基づいてエンドポイントを選択します。
エンドポイントの取得方法については、「エンドポイント」をご参照ください。
Access ID、Access Key
MaxCompute データソースが配置されているアカウントの AccessKey ID と AccessKey Secret です。
取得方法については、「AccessKey の取得」をご参照ください。
説明このパラメーターは、[認証タイプ] を [AccessKey 認証] に設定した場合にのみ構成できます。
プロジェクト名
これは DataWorks ワークスペース名ではなく、MaxCompute プロジェクト名です。
MaxCompute コンソールにログインし、左上のコーナーで適切なリージョンに切り替えてから、[プロジェクト管理] タブで特定の [MaxCompute プロジェクト名] を表示できます。
[デフォルトリソースグループ] を選択します。このリソースグループは、データベース SQL クエリ、オフラインでのデータベース全体の移行、データプレビューなど、現在のデータソースに関連するタスクを実行するために使用されます。
[接続テスト] をクリックするか、[OK] をクリックして構成を保存し、MaxCompute データソースを作成します。
[接続テスト] をクリックすると、データソースが Dataphin に接続できるかを確認できます。[OK] をクリックすると、選択したすべてのクラスターの接続が自動的にテストされます。すべての接続テストが失敗した場合でも、データソースは作成できます。