SelectDB データソースを作成することで、Dataphin が SelectDB からビジネスデータを読み取ったり、SelectDB にデータを書き込んだりできるようになります。このトピックでは、SelectDB データソースの作成方法について説明します。
背景情報
SelectDB は、リアルタイムレポート分析、アドホック多次元分析、ログ検索分析、データフェデレーション、クエリアクセラレーションなどのシナリオで広く使用されているデータウェアハウスです。ユーザーに優れたパフォーマンスと使いやすいデータ分析サービスを提供することに特化しています。
権限
データソースを作成できるのは、[データソース作成] 権限を持つカスタムグローバルロール、およびスーパー管理者、データソース管理者、ドメインアーキテクト、プロジェクト管理者などのシステムロールのみです。
操作手順
Dataphin のホームページで、上部のナビゲーションバーにある [管理ハブ] > [データソース管理] をクリックします。
[データソース] ページで、[+データソースの作成] をクリックします。
[データソースの作成] ページで、[ビッグデータ] セクションから [SelectDB] を選択します。
最近 SelectDB を使用したことがある場合は、[最近使用したもの] セクションから選択することもできます。また、検索ボックスに SelectDB のキーワードを入力して、すばやく検索することもできます。
[SelectDB データソースの作成] ページで、接続パラメーターを設定します。
データソースの基本情報を設定します
パラメーター
説明
[データソース名]
名前は次の要件を満たす必要があります:
漢字、英字、数字、アンダースコア (_)、ハイフン (-) のみ使用できます。
長さは 64 文字を超えることはできません。
[データソースコード]
データソースコードを設定すると、Flink_SQL タスクで
data_source_code.tableまたはdata_source_code.schema.tableの形式を使用してデータソース内のテーブルを参照できます。現在の環境に基づいて対応する環境のデータソースに自動的にアクセスするには、${data_source_code}.tableまたは${data_source_code}.schema.tableの形式を使用します。詳細については、「Flink_SQL タスク開発」をご参照ください。重要データソースコードは、設定後に変更することはできません。
データソースコードを設定した後にのみ、アセットディレクトリとアセットチェックリストのオブジェクト詳細ページでデータをプレビューできます。
Flink SQL では、現在、MySQL、Hologres、MaxCompute、Oracle、StarRocks、Hive、SelectDB、および GaussDB データウェアハウスサービス (DWS) のデータソースのみがサポートされています。
カーネルバージョン
[Cloud Core V3.0.x (Apache Doris V2.0.x ベース)] または [Cloud Core V4.0.x (Apache Doris V3.0.x ベース)] を選択できます。
[データソースの説明]
データソースの簡単な説明を入力します。説明は 128 文字を超えることはできません。
[データソース構成]
設定するデータソースを選択します:
ビジネスデータソースが本番データソースと開発データソースを区別する場合は、[本番 + 開発データソース] を選択します。
ビジネスデータソースが本番データソースと開発データソースを区別しない場合は、[本番データソース] を選択します。
タグ
タグを使用してデータソースを分類し、タグ付けできます。タグの作成方法については、「データソースタグの管理」をご参照ください。
データソースと Dataphin 間の接続パラメーターを設定します。
データソース構成で [本番 + 開発データソース] を選択した場合は、[本番 + 開発データソース] の接続情報を設定する必要があります。データソース構成が [本番データソース] の場合は、[本番データソース] の接続情報のみを設定する必要があります。
説明通常、本番データソースと開発データソースは、環境を分離し、開発アクティビティが本番環境に与える影響を軽減するために、別々のデータソースとして設定する必要があります。ただし、Dataphin では、同じパラメーター値を持つ同一のデータソースとして設定することもサポートしています。
パラメーター
説明
JDBC URL
SelectDB の JDBC URL 接続アドレスを入力します。フォーマットは次のとおりです:
jdbc:mysql://host:port/dbname。ユーザー名、パスワード
データベースにログインするためのユーザー名とパスワード。
FE ノード URL
FE (フロントエンド) のホストと HTTP ポート。フォーマットは
fe_host:http_port,fe_host:http_portです。複数の FE ノードがある場合は、コンマ (,) で区切ります。SelectDB のデフォルトの HTTP ポートは 8030 です。データソースの詳細設定を構成します。
パラメーター
説明
[connectTimeout]
データベースの connectTimeout 期間 (ミリ秒)。デフォルトは 900000 ミリ秒 (15 分) です。
説明JDBC URL に connectTimeout の設定が含まれている場合、connectTimeout は JDBC URL で設定されたタイムアウト値になります。
Dataphin V3.11 より前に作成されたデータソースの場合、デフォルトの connectTimeout は
-1であり、タイムアウト制限がないことを意味します。
[socketTimeout]
データベースの socketTimeout 期間 (ミリ秒)。デフォルトは 1800000 ミリ秒 (30 分) です。
説明JDBC URL に socketTimeout の設定が含まれている場合、socketTimeout は JDBC URL で設定されたタイムアウト値になります。
Dataphin V3.11 より前に作成されたデータソースの場合、デフォルトの socketTimeout は
-1であり、タイムアウト制限がないことを意味します。
接続の再試行
データベース接続がタイムアウトした場合、システムは指定されたリトライ回数に達するまで自動的に接続をリトライします。最大リトライ回数に達しても接続に失敗した場合、接続は失敗と見なされます。
説明デフォルトのリトライ回数は 1 です。0 から 10 の間の値を設定できます。
接続リトライ回数は、デフォルトでオフライン統合タスクとグローバル品質 (アセット品質機能モジュールを有効にする必要があります) に適用されます。オフライン統合タスクでは、タスクレベルのリトライ回数を個別に設定できます。
[デフォルトリソースグループ] を選択します。このリソースグループは、データベース SQL、オフラインデータベース移行、データプレビューなど、現在のデータソースに関連するタスクを実行するために使用されます。
[接続テスト] を実行するか、直接 [OK] をクリックして、SelectDB データソースの作成を保存し完了します。
[接続テスト] をクリックして、データソースが Dataphin に正常に接続できるかどうかをテストします。直接 [OK] をクリックすると、システムは選択したすべてのクラスターの接続を自動的にテストします。ただし、選択したすべてのクラスターが接続テストに失敗した場合でも、データソースは正常に作成できます。