DataWorks の OceanBase ノードを使用すると、OceanBase タスクの開発および定期的なスケジュール実行が可能であり、他のジョブとの統合も行えます。本トピックでは、OceanBase ノードを用いたタスク開発の主なワークフローについて説明します。
背景情報
OceanBase は、Ant Group および Alibaba が独自に開発した分散型リレーショナルデータベースです。強力な整合性、高可用性、高性能、オンラインでのスケーリング、低コスト、および SQL 標準・主要なリレーショナルデータベースに対する高い互換性を提供します。詳細については、「OceanBase とは」をご参照ください。
前提条件
ビジネスフローを作成します。
DataStudio では、開発がビジネスフロー単位で整理されています。ノードを作成する前に、必ずビジネスフローを作成してください。詳細については、「ワークフローの作成」をご参照ください。
OceanBase データソースが作成されます。
OceanBase データベースを DataWorks 内の OceanBase データソースとして登録することで、そのデータベース内のデータにアクセスできます。データソースの作成方法については、「データソース管理」をご参照ください。DataWorks における OceanBase データソースの利用方法については、「ApsaraDB for OceanBase データソース」をご参照ください。
説明OceanBase ノードは、Java Database Connectivity (JDBC) 接続文字列を用いて作成された OceanBase データソースのみをサポートします。
データソースとリソースグループ間のネットワーク接続が確立されました。
データソースが使用する予定のリソースグループに正しく接続できることを確認してください。ネットワーク接続の設定方法については、「ネットワーク接続ソリューション」をご参照ください。
(任意:RAM ユーザーの場合のみ必須)RAM ユーザーをワークスペースに追加し、開発者 または ワークスペース管理者 のロールを割り当てます。ワークスペース管理者ロールは権限が高いため、付与には十分な注意が必要です。詳細については、「ワークスペースへのメンバー追加」をご参照ください。
制限事項
対応リージョン:中国 (杭州)、中国 (上海)、中国 (北京)、中国 (深セン)、中国 (成都)、中国 (香港)、シンガポール、マレーシア (クアラルンプール)、ドイツ (フランクフルト)、米国 (シリコンバレー)、米国 (バージニア)。
手順 1:OceanBase ノードの作成
DataStudio ページに移動します。
DataWorks コンソール にログインします。上部ナビゲーションバーから目的のリージョンを選択します。左側ナビゲーションウィンドウで、 を選択します。表示されるページで、ドロップダウンリストから目的のワークスペースを選択し、データ開発へ移動 をクリックします。
対象のワークフローを右クリックし、 を選択します。
ノードの作成 ダイアログボックスで、ノードの 名前 を入力し、確認 をクリックします。ノードが作成され、以降はノード内でタスクの開発および構成が可能です。
手順 2:OceanBase タスクの開発
(任意)OceanBase データソースの選択
ワークスペースに複数の OceanBase データソースが存在する場合、ノード編集ページでデータソースを選択する必要があります。ワークスペースに OceanBase データソースが 1 つしか存在しない場合は、デフォルトでそのデータソースが使用されます。
OceanBase ノードは、Java Database Connectivity (JDBC) 接続文字列を用いて作成された OceanBase データソースのみをサポートします。
SQL コードの開発:シンプルな例
OceanBase ノードのコードエディタで、実行したいタスクのコードを記述します。以下のコードは一例です。
SELECT * FROM usertablename;SQL コードの開発:スケジュールパラメーターの使用
DataWorks では、繰り返しスケジュール実行のシナリオにおいて、コードに動的にパラメーターを渡すための スケジュールパラメーター を提供しています。ノードタスク内では、${variable_name} の形式で変数を定義できます。その後、ノード編集ページの右側ナビゲーションペインで スケジュール タブを開き、スケジュールパラメーター セクションで該当変数に値を割り当てます。サポートされるフォーマットおよび設定方法については、「スケジュールパラメーターのサポートフォーマット」および「スケジュールパラメーターの設定と使用方法」をご参照ください。
以下のコードは一例です。
SELECT '${var}'; -- スケジュールパラメーターと併用可能です。手順 3:タスクのスケジュール構成
タスクのスケジュールを構成するには、右側の スケジュール構成 をクリックしてプロパティを設定します。詳細については、「概要」をご参照ください。
提出前に、再実行プロパティ および 上流依存ノード を構成してください。
手順 4:タスクコードのデバッグ
タスクが正しく実行されることを確認するためにデバッグを行います。
(任意)デバッグ用のリソースグループを選択し、パラメーター値を割り当てます。
ツールバーの
アイコンをクリックします。パラメーター ダイアログボックスで、リソースグループを選択します。デバッグ用にスケジュールパラメーターの値を割り当てます。パラメーター割り当てのロジックについては、「タスクデバッグのプロセス」をご参照ください。
タスクコードを保存して実行します。
アイコンをクリックして保存し、その後
アイコンをクリックして実行します。(任意)スモークテストを実行します。
提出中または提出後にスモークテストを実行し、開発環境での実行を検証します。詳細については、「スモークテストの実施」をご参照ください。
ステップ 5: タスクを送信および公開する
スケジュールを有効化するため、ノードを提出および公開します。
ツールバーの
アイコンをクリックしてノードを保存します。ツールバーの
アイコンをクリックしてノードタスクを提出します。提出 ダイアログボックスで、変更内容の説明 を入力し、コードレビューのオプションを選択します。
説明提出前に、再実行プロパティ および 上流依存ノード を構成してください。
コードレビューは品質保証のための機能です。有効化した場合、公開前にレビュアーによる承認が必要となります。詳細については、「コードレビュー」をご参照ください。
標準モードのワークスペースでは、右上隅の 公開 をクリックして本番環境へデプロイします。詳細については、「タスクの公開」をご参照ください。
次のステップ
タスクが提出および公開されると、ノードの構成に基づき定期的に実行されます。ノード構成タブの右上隅にある O&M をクリックすると、オペレーションセンターに移動できます。オペレーションセンターでは、定期実行タスクのスケジュール状態および実行状態を確認できます。詳細については、「定期実行タスクの管理」をご参照ください。