Dataphin が AnalyticDB for PostgreSQL からビジネスデータを読み取ったり、データを書き込んだりできるように、AnalyticDB for PostgreSQL データソースを作成できます。このトピックでは、AnalyticDB for PostgreSQL データソースの作成方法について説明します。
背景情報
AnalyticDB for PostgreSQL は、Alibaba Cloud のクラウドネイティブなデータウェアハウスサービスです。これは、ANSI SQL 2003 および PostgreSQL と Oracle のデータベースエコシステムと互換性のある Massively Parallel Processing (MPP) データベースです。完全なトランザクション処理、高スループットの書き込み、および統一されたストリームとバッチ処理エンジンを提供します。AnalyticDB for PostgreSQL は、独自のコンピュートエンジンとハイブリッド行列ストレージを使用して、高パフォーマンスのデータ処理とオンライン分析を実現します。Dataphin で AnalyticDB for PostgreSQL を使用してデータ開発を行うには、まず AnalyticDB for PostgreSQL データソースを作成する必要があります。
権限
[データソースの作成] 権限を持つカスタムグローバルロール、およびスーパー管理者、データソース管理者、ドメインアーキテクト、プロジェクト管理者などのシステムロールのみがデータソースを作成できます。
操作手順
Dataphin のホームページの上部のメニューバーで、[管理センター] > [データソース管理] を選択します。
[データソース] ページで、[+ データソースの作成] をクリックします。
[データソースの作成] ページの [リレーショナルデータベース] セクションに移動し、[AnalyticDB for PostgreSQL] を選択します。
最近 AnalyticDB for PostgreSQL を使用した場合は、[最近使用したもの] セクションから選択することもできます。また、検索ボックスに AnalyticDB for PostgreSQL のキーワードを入力して、データソースをすばやく見つけることもできます。
[AnalyticDB for PostgreSQL データソースの作成] ページで、データソースの接続パラメーターを設定します。
データソースの基本情報を設定します。
パラメーター
説明
データソース名
名前は、次の要件を満たす必要があります。
漢字、英字、数字、アンダースコア (_)、ハイフン (-) のみ使用できます。
名前の長さは 64 文字以内にする必要があります。
データソースコード
データソースコードを設定すると、Flink_SQL ノードで
datasource_code.table_nameまたはdatasource_code.schema.table_nameのフォーマットでデータソース内のテーブルを参照できます。対応する環境でデータソースに自動的にアクセスするには、変数フォーマット${datasource_code}.tableまたは${datasource_code}.schema.tableを使用します。詳細については、「Dataphin データソーステーブルの開発」をご参照ください。重要データソースコードは、設定後に変更することはできません。
アセットディレクトリおよびアセットチェックリストのオブジェクト詳細ページでデータをプレビューできるのは、データソースコードが設定された後のみです。
Flink SQL では、現在、MySQL、Hologres、MaxCompute、Oracle、StarRocks、Hive、SelectDB、および GaussDB データウェアハウスサービス (DWS) のデータソースのみがサポートされています。
バージョン
[6.x] または [7.x] を選択します。デフォルト値は [6.x] です。
データソースの説明
データソースの簡単な説明です。説明は 128 文字以内にする必要があります。
タイムゾーン
タイムゾーンは、統合ノードで時間形式のデータを処理するために使用されます。デフォルトのタイムゾーンは [アジア/上海] です。[変更] をクリックして、目的のタイムゾーンを選択します。オプションは次のとおりです。
GMT:GMT-12:00、GMT-11:00、GMT-10:00、GMT-09:30、GMT-09:00、GMT-08:00、GMT-07:00、GMT-06:00、GMT-05:00、GMT-04:00、GMT-03:00、GMT-03:00、GMT-02:30、GMT-02:00、GMT-01:00、GMT+00:00、GMT+01:00、GMT+02:00、GMT+03:00、GMT+03:30、GMT+04:00、GMT+04:30、GMT+05:00、GMT+05:30、GMT+05:45、GMT+06:00、GMT+06:30、GMT+07:00、GMT+08:00、GMT+08:45、GMT+09:00、GMT+09:30、GMT+10:00、GMT+10:30、GMT+11:00、GMT+12:00、GMT+12:45、GMT+13:00、GMT+14:00。
夏時間:アフリカ/カイロ、アメリカ/シカゴ、アメリカ/デンバー、アメリカ/ロサンゼルス、アメリカ/ニューヨーク、アメリカ/サンパウロ、アジア/バンコク、アジア/ドバイ、アジア/コルカタ、アジア/上海、アジア/東京、大西洋/アゾレス、オーストラリア/シドニー、ヨーロッパ/ベルリン、ヨーロッパ/ロンドン、ヨーロッパ/モスクワ、ヨーロッパ/パリ、太平洋/オークランド、太平洋/ホノルル。
データソース構成
設定するデータソースを選択します。
ビジネスデータソースに本番データソースと開発データソースが別々にある場合は、[本番 + 開発データソース] を選択します。
ビジネスデータソースに本番データソースと開発データソースが別々にない場合は、[本番データソース] を選択します。
タグ
タグを使用してデータソースを分類できます。タグの作成方法の詳細については、「データソースタグの管理」をご参照ください。
データソースと Dataphin 間の接続パラメーターを設定します。
[データソース構成] を [本番 + 開発データソース] に設定した場合は、両方の環境の接続情報を設定する必要があります。[本番データソース] に設定した場合は、本番データソースの接続情報のみを設定する必要があります。
説明通常、本番データソースと開発データソースは別々に設定する必要があります。これにより、開発環境が本番環境から分離され、開発活動が本番データに与える影響が軽減されます。ただし、Dataphin は、同じパラメーター値を持つ単一のデータソースとして設定することもサポートしています。
[設定方法]で、[JDBC URL]または[ホスト]を選択します。デフォルト値は JDBC URL です。
JDBC URL 構成
パラメーター
説明
JDBC URL
1 つ以上の IP アドレスを設定できます。複数の IP アドレスはカンマ (,) で区切ります。
スキーマ
ユーザー名に関連付けられているスキーマを入力します。
ユーザー名、パスワード
データベースのユーザー名とパスワードです。
ホスト構成
ホスト構成
パラメーター
説明
サーバーアドレス
サーバーの IP アドレスとポート番号を入力します。
[+追加] をクリックして、複数の IP アドレスとポート番号のセットを追加します。
アイコンをクリックして、余分なセットを削除します。少なくとも 1 つのセットを保持する必要があります。dbname
データベース名を入力します。
パラメーター構成
パラメーター
説明
パラメーター
パラメーター名:既存のパラメーター名を選択するか、カスタムパラメーター名を入力します。
カスタムパラメーター名には、英字、数字、ピリオド (.)、アンダースコア (_)、ハイフン (-) のみ使用できます。
パラメーター値:パラメーター名が選択されている場合、このパラメーターは必須です。値には、英字、数字、ピリオド (.)、アンダースコア (_)、ハイフン (-) のみ使用できます。値は 256 文字を超えることはできません。
説明[+パラメーターの追加] をクリックして、複数のパラメーターを追加します。
アイコンをクリックして、余分なパラメーターを削除します。最大 30 個のパラメーターを追加できます。スキーマ (オプション)
読み取るスキーマ情報を入力します。クロススキーマのテーブル選択がサポートされています。テーブルが配置されているスキーマを選択します。スキーマを指定しない場合、データソースで設定されたスキーマがデフォルトで使用されます。
ユーザー名、パスワード
データベースのユーザー名とパスワードを入力します。
説明ホスト構成方法を使用してデータソースを作成し、その後 JDBC URL 構成方法に切り替えると、システムはサーバーの IP アドレスとポート番号を連結して JDBC URL を自動的に入力します。
データソースの詳細設定を構成します。
パラメーター
説明
connectTimeout
データベースの接続タイムアウト期間 (秒)。デフォルト値は 900 秒 (15 分) です。
説明JDBC URL に connectTimeout 構成が含まれている場合、JDBC URL で構成されたタイムアウト値が使用されます。
Dataphin V3.11 より前に作成されたデータソースの場合、connectTimeout のデフォルト値は
-1で、タイムアウト制限がないことを示します。
socketTimeout
データベースのソケットタイムアウト期間 (秒)。デフォルト値は 1800 秒 (30 分) です。
説明JDBC URL に socketTimeout 構成が含まれている場合、JDBC URL で構成されたタイムアウト値が使用されます。
Dataphin V3.11 より前に作成されたデータソースの場合、socketTimeout のデフォルト値は
-1で、タイムアウト制限がないことを示します。
接続リトライ回数
データベース接続がタイムアウトした場合、システムは指定されたリトライ回数に達するまで自動的に接続をリトライします。最大リトライ回数を超えても接続が失敗した場合、接続は失敗します。
説明デフォルトのリトライ回数は 1 です。0 から 10 の値を設定できます。
接続リトライ回数は、デフォルトでオフライン統合ノードとグローバル品質 (アセット品質モジュールが必要) に適用されます。オフライン統合ノードでは、ノードレベルのリトライ回数を個別に設定できます。
説明重複するパラメーターの優先順位ルール:
パラメーターが [JDBC URL]、[詳細設定]、および [ホスト構成] セクションで構成されている場合、[JDBC URL] の値が優先されます。
パラメーターが [JDBC URL] と [詳細設定] の両方で構成されている場合、[JDBC URL] の値が優先されます。
パラメーターが [詳細設定] と [ホスト構成] の両方で構成されている場合、[詳細設定] の値が優先されます。
[デフォルトリソースグループ] を選択します。このリソースグループは、データベース SQL、オフライン完全データベース移行、データプレビューなど、このデータソースに関連するノードを実行するために使用されます。
[接続テスト] または [OK] をクリックして構成を保存し、AnalyticDB for PostgreSQL データソースを作成します。
[接続テスト] をクリックすると、システムはデータソースが Dataphin に接続できるかどうかをテストします。[OK] を直接クリックすると、システムは選択したすべてのクラスターの接続を自動的にテストします。選択したすべてのクラスターで接続テストが失敗した場合でも、データソースを作成できます。