すべてのプロダクト
Search
ドキュメントセンター

Dataphin:Greenplum 入力コンポーネントを構成する

最終更新日:Feb 06, 2025

Greenplum 入力コンポーネントを使用すると、Greenplum データソースからデータを読み取ることができます。Greenplum から他のデータソースにデータを同期するには、Greenplum 入力コンポーネントを構成してデータソースにアクセスし、同期用のターゲットデータソースを設定します。このトピックでは、Greenplum 入力コンポーネントの構成プロセスについて概要を説明します。

前提条件

  • Greenplum データソースが確立されていること。詳細については、「GreenPlum データソースを作成する」または「」をご参照ください。

  • Greenplum 入力コンポーネントのプロパティを構成するには、アカウントにデータソースに対するリードスルー権限が必要です。これらの権限がない場合は、「データソース権限をリクエストする」必要があります。詳細については、「」をご参照ください。

手順

  1. 詳細については、「オフラインパイプラインコンポーネント開発エントリ」または「」をご参照ください。オフラインパイプラインスクリプトの開発ページにアクセスできます。

  2. [greenplum] [入力構成] ページに移動するには、次の手順に従います。

    [コンポーネントライブラリ] をクリックし、[入力] をクリックします。次に、[greenplum] 入力コンポーネントをキャンバスにドラッグします。最後に、image をクリックして構成にアクセスします。

    image

  3. [greenplum] [入力構成] ダイアログボックスで、次のようにパラメーターを設定します。

    パラメーター

    説明

    [ステップ名]

    Greenplum 入力コンポーネントに名前を割り当てます。Dataphin はデフォルト名を生成しますが、ビジネスニーズに合わせて変更できます。命名規則では、漢字、英字、アンダースコア (_)、数字を使用でき、64 文字を超えてはなりません。

    • 漢字、英字、アンダースコア (_)、数字のみで構成する必要があります。

    • 64 文字以下にする必要があります。

    [データソース]

    Dataphin のデータソースドロップダウンリストには、リードスルー権限を持つものと持たないものの両方を含む、すべての Greenplum データソースが表示されます。

    • データソースに対するリードスルー権限がない場合は、データソース名の後にある [リクエスト] をシングルクリックするだけでリクエストできます。詳細については、「データソース権限をリクエストする」または「」をご参照ください。

    • Greenplum データソースをまだ確立していない場合は、[作成] をクリックするだけで設定できます。詳細については、「GreenPlum データソースを作成する」または「」をご参照ください。

    [スキーマ]

    異なるスキーマにわたるテーブルの読み取りを有効にします。ソーステーブルを含む適切なスキーマを選択する必要があります。データソースリンクにはデフォルトでスキーマ情報が含まれている場合がありますが、必要な権限があれば、代替スキーマを選択することもできます。

    [ソーステーブル数量]

    ソーステーブルの数量を選択します。単一テーブルまたは複数テーブルを選択できます。

    • [単一テーブル]:単一のソーステーブルのデータを単一のターゲットテーブルと同期する必要がある場合に最適です。

    • [複数テーブル]:複数のソーステーブルのデータを1つのターゲットテーブルに統合する場合に適しています。これは、table_[001-100];table_102 のように、列挙形式正規表現のような形式混合形式など、さまざまなマッチングパターンをサポートしています。

    [シャードキー]

    最適なデータシャーディングと同時読み取りを実現するには、ソーステーブルの整数型の列をシャードキーとして使用することをお勧めします。データ同期の効率を高めるには、できればプライマリキーまたはインデックス付き列を選択してください。

    [バッチ読み取り数]

    レコードを個別に読み取るのではなく、バッチで読み取るレコード数を指定して、I/O 効率を最適化し、ネットワーク遅延を削減します。

    [入力フィルター]

    次の構成手順に従ってフィルター条件を設定し、データを抽出します。

    • 静的フィールドを設定して特定のデータを取得します。たとえば、ds=20210101 などです。

    • 変数パラメーターを設定してデータセグメントを取得します。たとえば、ds=${bizdate} などです。

    出力フィールド

    出力フィールド領域には、選択したテーブルとフィルター条件の影響を受けるすべてのフィールドが表示されます。特定のフィールドがダウンストリームコンポーネントに送信されないようにするには、それらのフィールドを削除します。

    • 単一フィールド削除シナリオ:少数のフィールドを削除する必要がある場合は、操作列の sgaga アイコンをシングルクリックして、余分なフィールドを削除できます。

    • バッチフィールド削除シナリオ:複数のフィールドを一度に削除するには、[フィールド管理] をクリックし、[フィールド管理] ダイアログボックス内で目的のフィールドを選択し、image 左シフトアイコンをクリックして選択したフィールドを未選択リストに転送し、[確認] をクリックしてバッチ削除を確定します。

      image..png

  4. 構成を完了するには、[確認] をクリックします。