すべてのプロダクト
Search
ドキュメントセンター

DataWorks:フィールド編集と値の割り当てコンポーネント

最終更新日:Jan 11, 2025

DataWorks Data Integration のリアルタイム抽出、変換、ロード (ETL) タスクは、フィールド編集と値の割り当てコンポーネントをサポートしています。ソースコンポーネントとデスティネーションコンポーネントの間にフィールド編集と値の割り当てコンポーネントを追加して、構成されたフィルタリングルールに基づいて新しいフィールドの値を変更および割り当てることができます。

前提条件

  • データ同期のための基本設定とネットワークリソースが構成されていること。

  • データ同期タイプが、単一テーブルからのデータのリアルタイム同期に設定されていること。

手順 1: Data Integration で同期タスクを構成する

  1. 必要なデータソースを DataWorks に追加します。詳細については、「データソースの追加と管理」をご参照ください。

  2. Data Integration で同期タスクを作成します。詳細については、「Data Integration 側同期タスク」ディレクトリのトピックをご参照ください。

    説明

    単一テーブルのデータをリアルタイムで同期するために使用する同期タスクを作成する場合、ソースコンポーネントとデスティネーションコンポーネントの間にデータ処理コンポーネントを追加できます。詳細については、「サポートされているデータソースの種類と同期操作」をご参照ください。

手順 2: フィールド編集と値の割り当てコンポーネントを追加する

  1. 同期タスクの構成ページの上部にあるウィザードで、imageソースタイプとデスティネーションタイプの間にある フィールドの編集と値の割り当て アイコンをクリックし、 を選択します。「フィールドの編集と値の割り当て」セクションが表示されます。

  2. フィールド編集と値の割り当てコンポーネントを構成します。

    image

    • フィールドの詳細を表示する。

      • [フィールド名]: 上位コンポーネントの出力フィールドの名前。

      • [タイプ]: 上位コンポーネントの出力フィールドのデータ型。

      • [値]: 上位コンポーネントの既存フィールドまたは新しく追加されたフィールドに値を割り当てる方法を指定します。有効な値: 割り当て、変数、関数。

      • [アクション]: 上位コンポーネントの出力フィールドを下位コンポーネントに渡すかどうかを決定できます。

    • [フィールドの追加]: [フィールドの編集と値の割り当て] セクションの左下隅にある [フィールドの追加] をクリックして、フィールドを追加します。次の情報は、新しいフィールドに値を割り当てる方法について説明しています。

      • [割り当て]: 手動で入力したテキストコンテンツを特定のデータ型に変換し、変換されたデータを値として新しいフィールドに割り当てます。

      • [変数]: 同期タスクの実行時に、組み込み変数の値を新しいフィールドに割り当てます。次の表は、サポートされている組み込み変数について説明しています。

        説明

        異なるソースとデスティネーションでサポートされる変数は、システム機能によって異なります。

        サポートされている変数

        変数

        説明

        ソース

        PROCESS_TIME

        同期タスクがデータレコードを消費する時刻。値はミリ秒単位の 13 桁のタイムスタンプです。

        DATASOURCE_NAME_SRC

        ソースの名前。

        DB_NAME_SRC

        ソースデータベースの名前。

        SCHEMA_NAME_SRC

        ソーススキーマの名前。

        TABLE_NAME_SRC

        ソーステーブルの名前。

        TOPIC_NAME_SRC

        ソーストピックの名前。

        デスティネーション

        TABLE_NAME_DEST

        デスティネーションテーブルの名前。

        TOPIC_NAME_DEST

        デスティネーショントピックの名前。

        SCHEMA_NAME_DEST

        デスティネーションスキーマの名前。

        DB_NAME_DEST

        デスティネーションデータベースの名前。

        DATASOURCE_NAME_DEST

        デスティネーションの名前。

      • [関数]: 同期タスクの実行時に関数計算を実行して、計算結果を値として新しいフィールドに割り当てます。関数処理中にエラーが発生した場合、対応するレコードはダーティデータと見なされ、同期タスクで収集されたダーティデータの統計に含まれます。その後、ダーティデータの許容構成に基づいて同期タスクを停止するかどうかを決定します。

        サポートされている関数

        関数

        パラメーター

        説明

        DATE_FORMAT

        • Parameter1: 数値型の上位フィールド。このフィールドの値は、10 桁の UNIX タイムスタンプまたはミリ秒単位の 13 桁のタイムスタンプです。

        • Parameter2: タイムスタンプのタイプ。有効な値: unix と millis。値 unix は 10 桁の UNIX タイムスタンプを示します。値 millis はミリ秒単位の 13 桁のタイムスタンプを示します。

        • Parameter3: 変換に使用するタイムゾーン。

        • Parameter4: タイムスタンプのフォーマットに使用する時間文字列形式。例: yyyy-MM-dd HH:mm:ss:SSS ZZyyyy は年、MM は月、dd は日、HH は 24 時間表記の時間、mm は分、ss は秒、SSS はミリ秒、ZZ はタイムゾーンを示します。

        タイムスタンプを特定の形式の時間文字列に変換します。

        TO_TIMESTAMP

        • Parameter1: テキスト型の上位フィールド。このフィールドの値は、特定の形式の時間文字列です。

        • Parameter2: タイムスタンプのタイプ。有効な値: unix と millis。値 unix は 10 桁の UNIX タイムスタンプを示します。値 millis はミリ秒単位の 13 桁のタイムスタンプを示します。

        • Parameter3: 変換に使用するタイムゾーン。

        • Parameter4: 時間文字列の形式。例: yyyy-MM-dd HH:mm:ss:SSS ZZyyyy は年、MM は月、dd は日、HH は 24 時間表記の時間、mm は分、ss は秒、SSS はミリ秒、ZZ はタイムゾーンを示します。

        時間文字列を 10 桁または 13 桁のタイムスタンプに変換します。

        SUBSTRING

        • Parameter1: テキスト型の上位フィールド。

        • Parameter2: 部分文字列の開始位置。部分文字列には、開始位置の文字が含まれます。最小開始位置は 0 です。

        • Parameter3: 部分文字列の長さ。長さが 0 以下の場合、開始位置から末尾までの部分文字列が返されます。

        文字列から部分文字列を取得します。

次の手順

同期タスクのソースフィールド編集と値の割り当てコンポーネントデスティネーションに関する情報を構成した後、構成ページの右上隅にある [シミュレーション実行の実行] をクリックして同期タスクをテストし、出力結果がビジネス要件を満たしているかどうかを確認できます。