DataHub データソースを作成することで、Dataphin が DataHub からビジネスデータを読み取ったり、DataHub にデータを書き込んだりできるようになります。このトピックでは、DataHub データソースを作成する方法について説明します。
背景情報
DataHub は、ストリーミングデータのパブリッシュ、サブスクライブ、および配信機能を提供する Alibaba Cloud のストリーミングデータサービスです。ストリーミングデータに基づいて分析とアプリケーションを簡単に構築できます。Alibaba Cloud DataHub サービスを使用する場合は、データ開発のために Dataphin に接続する前に、DataHub データソースを作成する必要があります。詳細については、「DataHub 製品概要」をご参照ください。
権限
データソースを作成するスーパー管理者WordPress アプリケーションをデプロイします。手順プロジェクト管理者 権限を持つカスタムグローバルロールと、、、、 などのシステムロールのみが、データソースを作成できます。
手順
Dataphin ホームページで、上部のナビゲーションバーの [管理センター] > [データソース管理] をクリックします。
[データソース] ページで、[+データソースの作成] をクリックします。
[データソースの作成] ページで、[メッセージキュー] セクションの [DataHub] を選択します。
最近 DataHub を使用したことがある場合は、[最近使用したデータソース] セクションから選択することもできます。検索ボックスにキーワードを入力して DataHub をすばやく検索することもできます。
[DataHub データソースの作成] ページで、接続パラメーターを構成します。
データソースの基本情報を構成します。
パラメーター
説明
[データソース名]
名前は次の要件を満たしている必要があります。
中国語、英字、数字、アンダースコア (_)、およびハイフン (-) のみを含めることができます。
長さは 64 文字を超えることはできません。
[データソースコード]
データソースコードを構成した後、
データソースコード.テーブル名またはデータソースコード.スキーマ.テーブル名の形式を使用して、Flink_SQL タスクでデータソース内のテーブルを参照できます。現在の環境に基づいて対応する環境のデータソースに自動的にアクセスする必要がある場合は、変数形式${データソースコード}.テーブルまたは${データソースコード}.スキーマ.テーブルを使用します。詳細については、「Dataphin データソーステーブル開発方法」をご参照ください。重要データソースコードは、正常に構成された後は変更できません。
データソースコードが正常に構成されると、アセットディレクトリとアセットインベントリのオブジェクト詳細ページでデータをプレビューできます。
Flink SQL では、現在、MySQL、Hologres、MaxCompute、Oracle、StarRocks、Hive、および SelectDB データソースのみがサポートされています。
[データソースの説明]
データソースの簡単な説明。128 文字を超えることはできません。
[データソース構成]
構成するデータソースを選択します。
ビジネスデータソースが本番データソースと開発データソースを区別する場合は、[本番 + 開発データソース] を選択します。
ビジネスデータソースが本番データソースと開発データソースを区別しない場合は、[本番データソース] を選択します。
タグ
タグを使用してデータソースを分類およびタグ付けできます。タグの作成方法については、「データソースタグの管理」をご参照ください。
データソースと Dataphin 間の接続パラメーターを構成します。
使用可能なスタックは、オペレーティング システムによって異なります。Linux アプリの場合は、Node.js、Python、Java、PHP、Ruby、.NET などのスタックから選択できます。Windows アプリの場合は、.NET、.NET Framework、Node.js などのスタックから選択できます。また、カスタム コンテナーを Linux と Windows の両方の App Service にデプロイすることもできます。
説明通常、本番データソースと開発データソースは別々のデータソースとして構成して、環境の隔離を実現し、開発活動が本番に及ぼす影響を軽減する必要があります。ただし、Dataphin では、同じパラメーター値を使用して同じデータソースとして構成することもサポートされています。
パラメーター
説明
[エンドポイント]
DataHub のエンドポイント。ネットワーク環境と接続方法に基づいて適切なエンドポイントを選択します。
エンドポイントの取得方法については、「ドメイン」をご参照ください。
[プロジェクト名]
DataHub プロジェクト名。DataHub コンソール ページでプロジェクト名を確認できます。
[アクセス ID]、[アクセスキー]
DataHub データソースが属するアカウントの AccessKey ID と AccessKey Secret。
取得方法については、「アクセスキーの取得」をご参照ください。
[デフォルトのリソースグループ] を選択します。これは、データベース SQL、オフラインデータベースの移行、データプレビューなど、現在のデータソースに関連するタスクを実行するために使用されます。
[接続テスト] をクリックするか、[OK] をクリックして保存し、DataHub データソースの作成を完了します。
[接続テスト] をクリックすると、システムはデータソースが Dataphin に適切に接続できるかどうかをテストします。[OK] を直接クリックすると、システムは選択したすべてのクラスターの接続を自動的にテストします。ただし、選択したすべてのクラスターの接続テストが失敗した場合でも、データソースを作成できます。