すべてのプロダクト
Search
ドキュメントセンター

Dataphin:TDH Inceptor 入力コンポーネントを構成する

最終更新日:Mar 06, 2025

TDH Inceptor 入力コンポーネントは、TDH Inceptor データソースからデータを読み取るために使用されます。 TDH Inceptor データソースから他のデータソースにデータを同期するには、まず TDH Inceptor 入力コンポーネントを構成してデータソース情報を読み取り、次に同期のターゲットデータソースを設定する必要があります。 このトピックでは、TDH Inceptor 入力コンポーネントの構成プロセスについて説明します。

制限事項

TDH Inceptor 入力コンポーネントは、ORC、Parquet、テキスト、RC、SEQ などの形式のデータテーブルをサポートしています。 ただし、ORC 形式のトランザクションテーブルの統合はサポートしていません。

前提条件

  • TDH Inceptor データソースが作成されている必要があります。 詳細については、「TDH Inceptor データソースを作成する」をご参照ください。

  • TDH Inceptor 入力コンポーネントのプロパティを構成するには、アカウントにデータソースのリードスルー権限が必要です。 この権限がない場合は、データソースから取得する必要があります。 詳細については、「データソース権限をリクエストする」をご参照ください。

手順

  1. Dataphin ホームページで、トップメニューバーから [開発] > [data Integration] を選択します。

  2. 統合ページのトップメニューバーで、プロジェクト を選択します(開発 - 本番モードでは環境を選択する必要があります)。

  3. 左側のナビゲーションウィンドウで、[バッチパイプライン] をクリックします。[バッチパイプライン] リストで、開発する オフラインパイプライン をクリックして構成ページを開きます。

  4. ページの右上隅にある [コンポーネントライブラリ] をクリックして、[コンポーネントライブラリ] パネルを開きます。

  5. [コンポーネントライブラリ] パネルの左側のナビゲーションウィンドウで、[入力] を選択します。 右側のリストで [TDH Inceptor] コンポーネントを見つけて、キャンバスにドラッグします。

  6. TDH Inceptor 入力コンポーネントカードの image アイコンをクリックして、[TDH Inceptor] [入力構成] ダイアログボックスを開きます。

  7. [TDH Inceptor 入力構成] ダイアログボックスで、パラメーターを設定します。

    パラメーター

    説明

    [ステップ名]

    これは TDH Inceptor 入力コンポーネントの名前です。 Dataphin はステップ名を自動的に生成しますが、ビジネスシナリオに応じて変更することもできます。 名前は次の要件を満たしている必要があります。

    • 日本語、英字、アンダースコア (_)、および数字のみ使用できます。

    • 64 文字を超えることはできません。

    [データソース]

    データソースドロップダウンリストには、現在の Dataphin 内のすべての TDH Inceptor タイプのデータソースが表示されます。これには、リードスルー権限を持つデータソースとリードスルー権限を持たないデータソースが含まれます。 image アイコンをクリックして、現在のデータソース名をコピーします。

    • リードスルー権限のないデータソースの場合、データソースの後に [リクエスト] をクリックして、リードスルー権限をリクエストできます。 詳細については、「データソース権限をリクエストする」をご参照ください。

    • TDH Inceptor タイプのデータソースがない場合は、[データソースの作成] をクリックしてデータソースを作成します。 詳細については、「TDH Inceptor データソースを作成する」をご参照ください。

    [テーブル]

    データ同期のソーステーブルを選択します。 image アイコンをクリックして、現在選択されているテーブルの名前をコピーします。

    [パーティション]

    選択したテーブルがパーティションテーブルの場合は、ds=${bizdate} などのパーティション情報を入力する必要があります。

    [パーティションが存在しない場合]

    指定されたパーティションが存在しないシナリオを処理するために、次のポリシーを選択できます。

    • [タスクを失敗させる]: タスクを終了し、失敗としてマークします。

    • [データを書き込まずにタスクを成功させる]: タスクはデータを書き込まずに正常に実行されます。

    [ファイルエンコーディング]

    ファイルのエンコード方式を選択します。 システムは [UTF-8] および [GBK] 方式をサポートしています。

    [圧縮形式]

    ファイルの圧縮形式を選択します。 システムは、[zlib][hadoop-snappy] などの圧縮形式をサポートしています。

    [フィールド区切り文字]

    ファイルストレージの区切り文字を入力します。 入力しない場合、システムはフィールド区切り文字をデフォルトでカンマ (,) に設定します。

    [出力フィールド]

    出力フィールドエリアには、選択したテーブルのすべてのフィールド情報が表示されます。 特定のフィールドをダウンストリームコンポーネントに出力する必要がない場合は、対応するフィールドを削除できます。

    説明

    コンピュートエンジンが TDH Inceptor の場合、TDH Inceptor 入力コンポーネントの出力フィールドは、フィールドの 分類 の表示をサポートします。 TDH Inceptor 以外のコンピュートエンジンはこれをサポートしていません。

    • 単一フィールド削除シナリオ: 少量のフィールドを削除する必要がある場合は、操作列の sgaga アイコンをクリックして、余分なフィールドを削除できます。

    • バッチフィールド削除シナリオ: 多くのフィールドを削除する必要がある場合は、[フィールド管理] をクリックし、[フィールド管理] ダイアログボックスで複数のフィールドを選択し、image 左シフトアイコンをクリックして、選択した入力フィールドを未選択の入力フィールドに移動し、[確認] をクリックして、フィールドのバッチ削除を完了します。

      image..png

  8. [確認] をクリックして、TDH Inceptor 入力コンポーネントのプロパティの構成を完了します。