Greenplum 入力コンポーネントを使用すると、Greenplum データソースからデータを読み取ることができます。Greenplum から他のデータソースにデータを同期するには、Greenplum 入力コンポーネントを構成してデータソースにアクセスし、同期用のターゲットデータソースを設定します。このトピックでは、Greenplum 入力コンポーネントの構成プロセスについて概要を説明します。
前提条件
Greenplum データソースが確立されていること。詳細については、「GreenPlum データソースを作成する」または「」をご参照ください。
Greenplum 入力コンポーネントのプロパティを構成するには、アカウントにデータソースに対するリードスルー権限が必要です。これらの権限がない場合は、「データソース権限をリクエストする」必要があります。詳細については、「」をご参照ください。
手順
詳細については、「オフラインパイプラインコンポーネント開発エントリ」または「」をご参照ください。オフラインパイプラインスクリプトの開発ページにアクセスできます。
[greenplum] [入力構成] ページに移動するには、次の手順に従います。
[コンポーネントライブラリ] をクリックし、[入力] をクリックします。次に、[greenplum] 入力コンポーネントをキャンバスにドラッグします。最後に、
をクリックして構成にアクセスします。
[greenplum] [入力構成] ダイアログボックスで、次のようにパラメーターを設定します。
パラメーター
説明
[ステップ名]
Greenplum 入力コンポーネントに名前を割り当てます。Dataphin はデフォルト名を生成しますが、ビジネスニーズに合わせて変更できます。命名規則では、漢字、英字、アンダースコア (_)、数字を使用でき、64 文字を超えてはなりません。
漢字、英字、アンダースコア (_)、数字のみで構成する必要があります。
64 文字以下にする必要があります。
[データソース]
Dataphin のデータソースドロップダウンリストには、リードスルー権限を持つものと持たないものの両方を含む、すべての Greenplum データソースが表示されます。
データソースに対するリードスルー権限がない場合は、データソース名の後にある [リクエスト] をシングルクリックするだけでリクエストできます。詳細については、「データソース権限をリクエストする」または「」をご参照ください。
Greenplum データソースをまだ確立していない場合は、[作成] をクリックするだけで設定できます。詳細については、「GreenPlum データソースを作成する」または「」をご参照ください。
[スキーマ]
異なるスキーマにわたるテーブルの読み取りを有効にします。ソーステーブルを含む適切なスキーマを選択する必要があります。データソースリンクにはデフォルトでスキーマ情報が含まれている場合がありますが、必要な権限があれば、代替スキーマを選択することもできます。
[ソーステーブル数量]
ソーステーブルの数量を選択します。単一テーブルまたは複数テーブルを選択できます。
[単一テーブル]:単一のソーステーブルのデータを単一のターゲットテーブルと同期する必要がある場合に最適です。
[複数テーブル]:複数のソーステーブルのデータを1つのターゲットテーブルに統合する場合に適しています。これは、
table_[001-100];table_102のように、列挙形式、正規表現のような形式、混合形式など、さまざまなマッチングパターンをサポートしています。
[シャードキー]
最適なデータシャーディングと同時読み取りを実現するには、ソーステーブルの整数型の列をシャードキーとして使用することをお勧めします。データ同期の効率を高めるには、できればプライマリキーまたはインデックス付き列を選択してください。
[バッチ読み取り数]
レコードを個別に読み取るのではなく、バッチで読み取るレコード数を指定して、I/O 効率を最適化し、ネットワーク遅延を削減します。
[入力フィルター]
次の構成手順に従ってフィルター条件を設定し、データを抽出します。
静的フィールドを設定して特定のデータを取得します。たとえば、
ds=20210101などです。変数パラメーターを設定してデータセグメントを取得します。たとえば、
ds=${bizdate}などです。
出力フィールド
出力フィールド領域には、選択したテーブルとフィルター条件の影響を受けるすべてのフィールドが表示されます。特定のフィールドがダウンストリームコンポーネントに送信されないようにするには、それらのフィールドを削除します。
単一フィールド削除シナリオ:少数のフィールドを削除する必要がある場合は、操作列の
アイコンをシングルクリックして、余分なフィールドを削除できます。バッチフィールド削除シナリオ:複数のフィールドを一度に削除するには、[フィールド管理] をクリックし、[フィールド管理] ダイアログボックス内で目的のフィールドを選択し、
左シフトアイコンをクリックして選択したフィールドを未選択リストに転送し、[確認] をクリックしてバッチ削除を確定します。
構成を完了するには、[確認] をクリックします。