AnalyticDB for PostgreSQL データソースを作成することで、Dataphin が AnalyticDB for PostgreSQL からビジネスデータを読み取ったり、データを書き込んだりできるようになります。このトピックでは、AnalyticDB for PostgreSQL データソースを作成する方法について説明します。
背景情報
AnalyticDB for PostgreSQL は、ANSI SQL 2003 および PostgreSQL/Oracle データベースエコシステムと互換性のある Alibaba Cloud のクラウドネイティブデータウェアハウスです。超並列処理(MPP)アーキテクチャを使用して、包括的なトランザクション処理機能、高スループットの書き込み、および統合されたバッチおよびストリーミング処理エンジンを提供します。 AnalyticDB for PostgreSQL は、ハイブリッド行 - 列ストレージと Alibaba Cloud の独自開発の計算エンジンを通じて、高性能データ処理とリアルタイム分析を実現します。 AnalyticDB for PostgreSQL を使用していて、データ開発のために Dataphin に接続する場合は、最初に AnalyticDB for PostgreSQL データソースを作成する必要があります。
権限要件
[データソースの作成] 権限を持つカスタムグローバルロール、および [スーパー管理者]、[データソース管理者]、[ドメインアーキテクト]、[プロジェクト管理者] などのシステムロールのみがデータソースを作成できます。
手順
Dataphin ホームページの上部ナビゲーションバーで、[管理センター] > [データソース管理] を選択します。
[データソース] ページで、[+データソースの作成] をクリックします。
[データソースの作成] ページで、[リレーショナルデータベース] セクションの [AnalyticDB For PostgreSQL] を選択します。
最近 AnalyticDB for PostgreSQL を使用した場合は、[最近使用した] セクションで選択することもできます。検索ボックスに AnalyticDB for PostgreSQL に関連するキーワードを入力して、すぐに見つけることもできます。
[AnalyticDB For PostgreSQL データソースの作成] ページで、接続パラメーターを構成します。
データソースの基本情報を構成します。
パラメーター
説明
データソース名
名前は次の要件を満たしている必要があります。
漢字、英字、数字、アンダースコア(_)、ハイフン(-)のみを含めることができます。
名前は最大 64 文字までです。
データソースコード
データソースコードを構成した後、
data_source_code.table_nameまたはdata_source_code.schema.table_nameの形式を使用して、Flink_SQL タスクでデータソース内のテーブルを参照できます。現在の環境に基づいて対応する環境のデータソースに自動的にアクセスする必要がある場合は、変数形式${data_source_code}.tableまたは${data_source_code}.schema.tableを使用できます。詳細については、「Dataphin データソーステーブル開発方法」をご参照ください。重要データソースコードは、正常に構成された後は変更できません。
データソースコードが正常に構成されると、アセットディレクトリとアセットインベントリのオブジェクト詳細ページでデータをプレビューできます。
Flink SQL では、現在、MySQL、Hologres、MaxCompute、Oracle、StarRocks、Hive、および SelectDB データソースのみがサポートされています。
バージョン
[6.x] または [7.x] を選択できます。デフォルトの選択は [6.x] です。
データソースの説明
データソースの簡単な説明。128 文字を超えることはできません。
タイムゾーン
タイムゾーンは、統合タスクで時間形式データを処理するために使用されます。デフォルトのタイムゾーンは [Asia/Shanghai] です。[変更] をクリックして、次のオプションからターゲットタイムゾーンを選択します。
[GMT]:[GMT-12:00]、[GMT-11:00]、[GMT-10:00]、[GMT-09:30]、[GMT-09:00]、[GMT-08:00]、[GMT-07:00]、[GMT-06:00]、[GMT-05:00]、[GMT-04:00]、[GMT-03:00]、[GMT-03:00]、[GMT-02:30]、[GMT-02:00]、[GMT-01:00]、[GMT+00:00]、[GMT+01:00]、[GMT+02:00]、[GMT+03:00]、[GMT+03:30]、[GMT+04:00]、[GMT+04:30]、[GMT+05:00]、[GMT+05:30]、[GMT+05:45]、[GMT+06:00]、[GMT+06:30]、[GMT+07:00]、[GMT+08:00]、[GMT+08:45]、[GMT+09:00]、[GMT+09:30]、[GMT+10:00]、[GMT+10:30]、[GMT+11:00]、[GMT+12:00]、[GMT+12:45]、[GMT+13:00]、[GMT+14:00]。
[夏時間]:[Africa/Cairo]、[America/Chicago]、[America/Denver]、[America/Los_Angeles]、[America/New_York]、[America/Sao_Paulo]、[Asia/Bangkok]、[Asia/Dubai]、[Asia/Kolkata]、[Asia/Shanghai]、[Asia/Tokyo]、[Atlantic/Azores]、[Australia/Sydney]、[Europe/Berlin]、[Europe/London]、[Europe/Moscow]、[Europe/Paris]、[Pacific/Auckland]、[Pacific/Honolulu]。
データソース構成
構成するデータソースを選択します。
ビジネスデータソースが本番データソースと開発データソースを区別している場合は、[本番 + 開発データソース] を選択します。
ビジネスデータソースが本番データソースと開発データソースを区別していない場合は、[本番データソース] を選択します。
タグ
タグを使用してデータソースを分類およびタグ付けできます。タグの作成方法については、「データソースタグの管理」をご参照ください。
データソースと Dataphin 間の接続パラメーターを構成します。
データソースの構成で [本番 + 開発データソース] を選択した場合、[本番 + 開発データソース] の両方の接続情報を設定する必要があります。 [本番データソース] を選択した場合は、[本番データソース] の接続情報のみを設定する必要があります。
説明通常、本番データソースと開発データソースは別々のデータソースとして構成して、開発と本番の間の環境分離を実現し、開発アクティビティが本番データソースに与える影響を軽減する必要があります。ただし、Dataphin では、同じパラメーター値を持つ同じデータソースとして構成することもサポートされています。
[構成方法] には、[JDBC URL] または [ホスト] を選択できます。デフォルトの選択は JDBC URL です。
JDBC URL 構成方法
パラメーター
説明
JDBC URL
1 つ以上の IP アドレスを構成できます。複数の IP アドレスはコンマ(,)で区切ります。
スキーマ
ユーザー名に関連付けられたスキーマを入力します。
ユーザー名、パスワード
データベースのユーザー名とパスワード。
ホスト構成方法
ホスト構成方法
パラメーター
説明
サーバーアドレス
サーバーの IP アドレスとポート番号を入力します。
[+追加] をクリックして、複数の IP アドレスとポート番号のセットを追加し、
アイコンをクリックして、余分な IP アドレスとポート番号を削除します。少なくとも 1 セットは保持する必要があります。dbname
データベース名を入力します。
パラメーター構成
パラメーター
説明
パラメーター
パラメーター名:既存のパラメーター名を選択するか、カスタムパラメーター名を入力できます。
カスタムパラメーター名には、英字、数字、ピリオド(.)、アンダースコア(_)、ハイフン(-)のみを含めることができます。
パラメーター値:パラメーター名が選択されている場合、パラメーター値は必須です。英字、数字、ピリオド(.)、アンダースコア(_)、ハイフン(-)のみを含めることができ、256 文字を超えることはできません。
説明[+パラメーターの追加] をクリックして複数のパラメーターを追加し、
アイコンをクリックして余分なパラメーターを削除します。最大 30 個のパラメーターを追加できます。スキーマ (オプション)
読み取る特定のスキーマ情報を入力します。クロススキーマテーブル選択がサポートされています。テーブルが配置されているスキーマを選択してください。指定しない場合、デフォルトはデータソースで構成されたスキーマです。
ユーザー名、パスワード
データベースのユーザー名とパスワードを入力します。
説明ホスト構成方法でデータソースを作成した後、JDBC URL 構成方法に切り替える必要がある場合、システムはサーバーの IP アドレスとポート番号を JDBC URL 形式に連結します。
データソースの高度な設定を構成します。
パラメーター
説明
connectTimeout
データベースの connectTimeout の期間(秒単位)。デフォルトは 900 秒(15 分)です。
説明JDBC URL に connectTimeout 構成がある場合、connectTimeout は JDBC URL で構成されたタイムアウト値になります。
Dataphin V3.11 以前に作成されたデータソースの場合、デフォルトの connectTimeout は
-1で、タイムアウト制限がないことを意味します。
socketTimeout
データベースの socketTimeout の期間(秒単位)。デフォルトは 1800 秒(30 分)です。
説明JDBC URL に socketTimeout 構成がある場合、socketTimeout は JDBC URL で構成されたタイムアウト値になります。
Dataphin V3.11 以前に作成されたデータソースの場合、デフォルトの socketTimeout は
-1で、タイムアウト制限がないことを意味します。
接続再試行回数
データベース接続がタイムアウトした場合、システムは指定された再試行回数に達するまで接続を自動的に再試行します。最大再試行回数に達しても接続が失敗する場合は、接続は失敗します。
説明デフォルトの再試行回数は 1 です。 0 から 10 までの値を構成できます。
接続再試行回数は、デフォルトで [オフライン統合タスク] と [グローバル品質] に適用されます(アセット品質機能モジュールを有効にする必要があります)。オフライン統合タスクでは、タスクレベルの再試行回数を個別に構成できます。
説明重複パラメーター値のルール:
パラメーターが [JDBC URL]、[詳細設定]、および [ホスト構成] パラメーター設定に同時に存在する場合、[JDBC URL] の値が優先されます。
パラメーターが [JDBC URL] と [詳細設定] の両方に存在する場合、[JDBC URL] の値が優先されます。
パラメーターが [詳細設定] と [ホスト構成] パラメーター設定の両方に存在する場合、[詳細設定] の値が優先されます。
[デフォルトリソースグループ] を選択します。このリソースグループは、データベース SQL、オフラインデータベース移行、データプレビューなど、現在のデータソースに関連するタスクを実行するために使用されます。
[接続テスト] をクリックするか、直接 [OK] をクリックして、AnalyticDB for PostgreSQL データソースの作成を保存して完了します。
[接続テスト] をクリックすると、システムはデータソースが Dataphin に正常に接続できるかどうかをテストします。直接 [OK] をクリックすると、システムは選択したすべてのクラスターの接続を自動的にテストします。ただし、選択したすべてのクラスターの接続テストが失敗した場合でも、データソースは正常に作成できます。