Snowflake データソースを作成すると、Dataphin が Snowflake からビジネスデータを読み取れるようになります。このトピックでは、Snowflake データソースの作成方法について説明します。
権限
スーパー管理者、データソース管理者、ドメインアーキテクト、プロジェクト管理者、およびデータソース作成権限を持つカスタムグローバルロールのみがデータソースを作成できます。
操作手順
Dataphin のホームページで、上部のメニューバーから [管理センター] > [データソース管理] を選択します。
[データソース] ページで、[+ 新規データソース] をクリックします。
[新規データソース] ページの [ビッグデータ] セクションで、[Snowflake] を選択します。
最近 Snowflake を使用したことがある場合は、[最近使用した項目] セクションから選択することもできます。または、検索ボックスに `Snowflake` と入力してすばやく見つけることもできます。
[Snowflake データソースの作成] ページで、接続パラメーターを設定します。
データソースの基本情報の設定
パラメーター
説明
データソース名
データソースの名前を入力します。名前は、次の要件を満たす必要があります。
漢字、大文字と小文字の英字、数字、アンダースコア (_)、ハイフン (-) を使用できます。
長さは 64 文字以内である必要があります。
データソースコード
データソースコードを設定すると、Flink_SQL タスクまたは Dataphin Java Database Connectivity (JDBC) クライアントで Dataphin データソーステーブルに直接アクセスできます。迅速なアクセスのためには、
DataSourceCode.TableNameまたはDataSourceCode.schema.TableNameのフォーマットを使用します。タスク実行環境に基づいてデータソースを自動的に切り替えるには、変数フォーマット${DataSourceCode}.tableまたは${DataSourceCode}.schema.tableを使用します。詳細については、「Dataphin データソーステーブルの開発メソッド」をご参照ください。重要データソースコードは、一度設定すると変更できません。
アセットディレクトリおよびアセットチェックリストのオブジェクト詳細ページでデータをプレビューできるのは、データソースコードが設定された後のみです。
現在、Flink SQL では、MySQL、Hologres、MaxCompute、Oracle、StarRocks、Hive、SelectDB、および GaussDB データウェアハウスサービス (DWS) のデータソースのみがサポートされています。
バージョン
現在、バージョン 3.27.0 のみがサポートされています。
データソースの説明
Snowflake データソースの簡単な説明です。説明は 128 文字以内にする必要があります。
タイムゾーン
統合タスクにおける時間フォーマットのデータは、選択されたタイムゾーンに基づいて処理されます。デフォルトのタイムゾーンは [Asia/Shanghai] です。[変更] をクリックして、別のタイムゾーンを選択します。オプションは次のとおりです:
GMT: GMT-12:00、GMT-11:00、GMT-10:00、GMT-09:30、GMT-09:00、GMT-08:00、GMT-07:00、GMT-06:00、GMT-05:00、GMT-04:00、GMT-03:00、GMT-03:00、GMT-02:30、GMT-02:00、GMT-01:00、GMT+00:00、GMT+01:00、GMT+02:00、GMT+03:00、GMT+03:30、GMT+04:00、GMT+04:30、GMT+05:00、GMT+05:30、GMT+05:45、GMT+06:00、GMT+06:30、GMT+07:00、GMT+08:00、GMT+08:45、GMT+09:00、GMT+09:30、GMT+10:00、GMT+10:30、GMT+11:00、GMT+12:00、GMT+12:45、GMT+13:00、GMT+14:00。
夏時間: Africa/Cairo、America/Chicago、America/Denver、America/Los_Angeles、America/New_York、America/Sao_Paulo、Asia/Bangkok、Asia/Dubai、Asia/Kolkata、Asia/Shanghai、Asia/Tokyo、Atlantic/Azores、Australia/Sydney、Europe/Berlin、Europe/London、Europe/Moscow、Europe/Paris、Pacific/Auckland、Pacific/Honolulu。
データソース構成
この設定は、ご利用のビジネスデータソースが本番環境と開発環境に分離されているかどうかによって異なります:
ビジネスデータソースが分離されている場合は、[本番 + 開発データソース] を選択します。
ビジネスデータソースが分離されていない場合は、[本番データソース] を選択します。
タグ
タグを追加してデータソースを分類できます。タグの作成方法の詳細については、「データソースタグの管理」をご参照ください。
データソースと Dataphin 間の接続パラメーターの設定
[データソース構成] を [本番 + 開発データソース] に設定した場合、両方の接続情報を設定する必要があります。[本番データソース] を選択した場合は、本番データソースの接続情報のみを設定します。
説明通常、本番環境と開発環境を分離し、開発アクティビティが本番環境に与える影響を軽減するために、本番データソースと開発データソースは異なるものにする必要があります。ただし、Dataphin では、同じパラメーター値を使用して、これらを同じデータソースとして設定できます。
パラメーター
説明
サーバーアドレス
サーバーアドレスを
{Account}.snowflakecomputing.comのフォーマットで入力します。サポートされているエンドポイントは 1 つだけで、追加はできません。ロール
Snowflake のアクセスロールを入力します。そのロールにウェアハウスを使用する権限があることを確認してください。
ウェアハウス
Snowflake のコンピュートウェアハウスを入力します。これは、データの読み取りと書き込みのためのコンピューティングリソースです。実行中の状態である必要があります。
データベース
ターゲットデータベースの名前を入力します。このデータベースへのアクセス権限が必要です。
スキーマ
スキーマを入力します。デフォルト値は PUBLIC です。
ユーザー名、パスワード
認証用のユーザー名とパスワード (または認証情報) を入力します。タスクが正しく実行されるように、ユーザーが必要なデータ権限を持っていることを確認してください。
パラメーター設定 (オプション)
[+ パラメーター設定] をクリックして行を追加します。[パラメーター名] とそれに対応する [パラメーター値] を入力します。パラメーターを削除するには、その行の
アイコンをクリックします。パラメーター名と値には、大文字と小文字の英字、数字、ピリオド (.)、アンダースコア (_)、ハイフン (-) を使用できます。長さは 256 文字以内である必要があります。
[デフォルトリソースグループ] を選択します。このリソースグループは、データベース SQL タスク、データベース全体のオフライン移行、データプレビューなど、このデータソースに関連するタスクを実行するために使用されます。
[接続テスト] または [OK] をクリックして設定を保存し、Snowflake データソースを作成します。
[接続テスト] をクリックして、Dataphin がデータソースに接続できることを確認します。[OK] をクリックすると、システムは選択されたすべてのクラスターの接続を自動的にテストします。接続テストが失敗した場合でも、データソースは作成されます。