DataWorks の PolarDB for PostgreSQL ノードを使用して、PolarDB for PostgreSQL タスクを開発し、定期的にスケジューリングできます。これらのタスクを他のタスクと統合することも可能です。このトピックでは、PolarDB for PostgreSQL ノードを使用したタスク開発の主なプロセスについて説明します。
背景情報
PolarDB for PostgreSQL は、Alibaba Cloud が開発したクラウドネイティブなリレーショナルデータベースプロダクトです。PostgreSQL と 100% 互換性があり、Oracle 構文との高い互換性を提供します。高速、弾力的、高性能、安全、かつ信頼性の高いデータベースサービスを、大容量ストレージ機能とともに提供します。また、Alibaba Cloud が開発した Ganos 多次元・マルチモーダル時空間情報エンジンと、オープンソースの PostGIS 地理情報エンジンもサポートしています。詳細については、「PolarDB for PostgreSQL」をご参照ください。
前提条件
ビジネスフローの作成。
DataStudio はビジネスフローによって開発を整理します。ノードを作成する前に、ビジネスフローを作成する必要があります。詳細については、「ワークフローの作成」をご参照ください。
PolarDB for PostgreSQL データソースが作成済みであること。
ご利用の PolarDB for PostgreSQL データベースを、DataWorks に PolarDB for PostgreSQL データソースとして追加する必要があります。これにより、データソースを使用してデータベース内のデータにアクセスできます。データソースの作成方法の詳細については、「データソース管理」をご参照ください。DataWorks での PolarDB for PostgreSQL データソースの使用方法の詳細については、「PolarDB データソース」をご参照ください。
説明PolarDB for MySQL ノードは、JDBC 接続文字列で作成された PolarDB for MySQL データソースのみをサポートします。
データソースとリソースグループ間のネットワーク接続が確立されています。
データソースが使用したいリソースグループに接続できることを確認してください。ネットワーク接続の設定方法については、「ネットワーク接続ソリューション」をご参照ください。
(任意。RAM ユーザーの場合に必要) RAM ユーザーをワークスペースに追加し、[開発] または [ワークスペース管理者] ロールを割り当てます。[ワークスペース管理者] ロールは権限が強いため、慎重に付与してください。詳細については、「ワークスペースへのメンバーの追加」をご参照ください。
制限事項
サポートされているリージョン:中国 (杭州)、中国 (上海)、中国 (北京)、中国 (深セン)、中国 (成都)、中国 (香港)、シンガポール、マレーシア (クアラルンプール)、ドイツ (フランクフルト)、米国 (シリコンバレー)、および米国 (バージニア)。
ステップ 1:PolarDB for PostgreSQL ノードの作成
DataStudio ページに移動します。
DataWorks コンソールにログインします。上部のナビゲーションバーで、目的のリージョンを選択します。左側のナビゲーションウィンドウで、 を選択します。表示されたページで、ドロップダウンリストから目的のワークスペースを選択し、[データ開発へ] をクリックします。
対象のビジネスプロセスを右クリックし、 を選択します。
[ノードの作成] ダイアログボックスで、ノードの [名前] パラメーターを設定し、[OK] をクリックします。ノードが作成された後、ノード設定タブでタスクを開発および設定できます。
ステップ 2:PolarDB for PostgreSQL タスクの開発
(任意) PolarDB for PostgreSQL データソースの選択
ワークスペースに複数の PolarDB for PostgreSQL データソースが存在する場合、ノード編集ページで目的のデータソースを選択する必要があります。PolarDB for PostgreSQL データソースが 1 つしか存在しない場合は、デフォルトで使用されます。
PolarDB for MySQL ノードは、Java Database Connectivity (JDBC) 接続文字列を使用して作成された PolarDB for MySQL データソースのみをサポートします。
SQL コードの開発:簡単な例
PolarDB for PostgreSQL ノードのコードエディタで、実行したいタスクのコードを記述します。以下のコードは一例です。
SELECT * FROM usertablename;SQL コードの開発:スケジューリングパラメーターの使用
DataWorks は、定期的なスケジュールでコード内の変数に動的に値を渡すことができるスケジューリングパラメーターを提供します。タスクコード内で変数を ${variable_name} のフォーマットで定義できます。その後、右側のナビゲーションウィンドウの [スケジュール] タブで [スケジューリングパラメーター] をクリックして、変数に値を割り当てます。スケジューリングパラメーターでサポートされているフォーマットと設定の詳細については、「スケジューリングパラメーターでサポートされているフォーマット」および「スケジューリングパラメーターの設定と使用」をご参照ください。
以下のコードは一例です。
SELECT '${var}'; -- スケジューリングパラメーターと併用できます。ステップ 3:タスクスケジュールの設定
タスクをスケジューリングするには、右側の [スケジュール設定] をクリックしてプロパティを設定します。詳細については、「概要」をご参照ください。
送信する前に [再実行プロパティ] と [上流依存ノード] を設定してください。
ステップ 4:タスクコードのデバッグ
タスクをデバッグして、正しく実行されることを確認します。
(任意) デバッグ用のリソースグループを選択し、パラメーター値を割り当てます。
ツールバーの
アイコンをクリックします。[パラメーター] ダイアログボックスで、リソースグループを選択します。デバッグ用に、スケジューリングパラメーターに値を割り当てます。パラメーターの割り当てロジックの詳細については、「タスクのデバッグプロセス」をご参照ください。
タスクコードを保存して実行します。
アイコンをクリックして保存し、
アイコンをクリックして実行します。(任意) スモークテストを実行します。
送信中または送信後にスモークテストを実行して、開発環境での実行を検証します。詳細については、「スモークテストの実行」をご参照ください。
ステップ 5:タスクの送信と公開
ノードを送信して公開し、スケジュールを有効化します。
ツールバーの
アイコンをクリックしてノードを保存します。ツールバーの
アイコンをクリックしてノードタスクを送信します。[送信] ダイアログボックスで、[変更の説明] を入力し、コードレビューオプションを選択します。
説明送信する前に [再実行プロパティ] と [上流依存ノード] を設定してください。
コードレビューは品質を保証します。有効になっている場合、公開前にレビュー担当者がコードを承認する必要があります。詳細については、「コードレビュー」をご参照ください。
標準モードのワークスペースでは、右上の [公開] をクリックして本番環境にデプロイします。詳細については、「タスクの公開」をご参照ください。
次のステップ
タスクが送信され公開されると、ノードの設定に基づいて定期的に実行されます。ノード設定タブの右上にある [運用保守] をクリックして、オペレーションセンターに移動できます。オペレーションセンターでは、定期タスクのスケジューリングと実行ステータスを確認できます。詳細については、「定期タスクの管理」をご参照ください。