ArgoDB 入力ウィジェットは、ArgoDB データソースからデータを読み取るように設計されています。ArgoDB データソースから他のデータソースにデータを同期する必要がある場合は、まず ArgoDB 入力ウィジェットのデータソースを構成し、次にデータ同期のターゲットデータソースを構成することが不可欠です。このトピックでは、ArgoDB 入力ウィジェットを構成する手順について説明します。
制限事項
ArgoDB 入力ウィジェットは、orc、parquet、text、holodesk、rc、seq などのデータ形式の ArgoDB テーブルをサポートしています。ただし、ORC 形式のトランザクションテーブルの統合はサポートしていません。
前提条件
ArgoDB データソースが作成されていること。詳細については、「ArgoDB データソースを作成する」をご参照ください。
ArgoDB 入力ウィジェットのプロパティを構成するには、アカウントにデータソースのリードスルー権限が必要です。必要な権限がない場合は、データソースの権限を取得する必要があります。詳細については、「データソース権限をリクエストする」をご参照ください。
手順
Dataphin ホームページで、トップメニューバーから [開発] > [data Integration] を選択します。
統合ページのトップメニューバーで、[プロジェクト] を選択します(開発 - 本番モードでは環境を選択する必要があります)。
左側のナビゲーションウィンドウで、[バッチパイプライン] をクリックします。次に、[バッチパイプライン] リストで、開発する [オフラインパイプライン] をクリックして、構成ページを開きます。
ページの右上隅にある [コンポーネントライブラリ] をクリックして、[コンポーネントライブラリ] パネルを開きます。
[コンポーネントライブラリ] パネルの左側のナビゲーションウィンドウで、[入力] を選択します。右側の入力ウィジェットリストで [argodb] ウィジェットを見つけ、キャンバスにドラッグします。
ArgoDB 入力ウィジェットカードの
アイコンをクリックして、[argodb] [入力構成] ダイアログボックスを開きます。[argodb 入力構成] ダイアログボックスで、パラメーターを構成します。
パラメーター
説明
ステップ名
これは ArgoDB 入力ウィジェットの名前です。Dataphin はステップ名を自動的に生成しますが、ビジネスシナリオに応じて変更することもできます。命名規則は次のとおりです。
中国語、英字、アンダースコア(_)、数字のみ使用できます。
64 文字を超えることはできません。
データソース
データソースドロップダウンリストには、現在 Dataphin にあるすべての ArgoDB タイプのデータソースが表示されます。これには、リードスルー権限を持つデータソースと持たないデータソースが含まれます。
アイコンをクリックして、現在のデータソース名をコピーします。リードスルー権限のないデータソースの場合、データソースの後に [リクエスト] をクリックして、データソースのリードスルー権限をリクエストできます。詳細については、「データソース権限をリクエストする」をご参照ください。
ArgoDB タイプのデータソースがない場合は、[データソースの作成] をクリックしてデータソースを作成します。詳細については、「ArgoDB データソースを作成する」をご参照ください。
テーブル
実際のシナリオに応じて、統合するデータテーブルを選択します。
アイコンをクリックして、現在選択されているテーブルの名前をコピーします。パーティション
選択したソーステーブルがパーティションテーブルの場合は、
state_date=‘20190101’などのパーティション情報を入力する必要があります。state_date=${bizdate}など、パラメーターメソッドを使用して毎日データを増分的に取得することもサポートしています。ファイルエンコード
実際のデータ状況に応じてエンコード形式を選択します。[UTF-8] と [GBK] をサポートしています。
圧縮形式
これはオプションです。ファイルが圧縮されている場合は、対応する圧縮形式を選択して、Dataphin で解凍できるようにします。
フィールド区切り文字
設定されたフィールド区切り文字を使用して、ターゲットデータソースに書き込みます。入力しない場合、デフォルトは
\u0001です。出力フィールド
出力フィールド領域には、選択したテーブルのすべてのフィールドが表示されます。特定のフィールドをダウンストリームウィジェットに出力する必要がない場合は、対応するフィールドを削除できます。
説明コンピューティングエンジンが ArgoDB の場合、ArgoDB 入力ウィジェットの出力フィールドは、フィールドの [分類と格付け] の表示をサポートしています。ArgoDB 以外のコンピューティングエンジンはこれをサポートしていません。
少数のフィールドを削除する必要がある場合は、操作列の
アイコンをクリックして、余分なフィールドを削除できます。多数のフィールドを削除する必要がある場合は、[フィールド管理] をクリックし、フィールド管理ページで複数のフィールドを選択して、
アイコンをクリックして、選択した入力フィールドを未選択の入力フィールドに移動します。
[確認] をクリックして、ArgoDB 入力ウィジェットのプロパティ構成を完了します。