MaxCompute 入力ウィジェットを使用すると、MaxCompute ソースからデータを読み取ることができます。MaxCompute から他のソースにデータを同期する場合、MaxCompute 入力ウィジェットのソースと同期先のデータソースを構成することが重要です。このトピックでは、構成プロセスについて説明します。
前提条件
MaxCompute データソースが作成されていること。詳細については、「MaxCompute データソースを作成する」をご参照ください。
MaxCompute 入力ウィジェットのプロパティを構成するには、アカウントにデータソースのリードスルー権限が必要です。この権限がない場合は、データソースから取得する必要があります。詳細については、「データソース権限をリクエストする」をご参照ください。
手順
Dataphin ホームページの上部メニューバーから、[開発] > [data Integration] を選択します。
統合ページの上部メニューバーで、プロジェクト を選択します(開発-本番モードでは環境を選択する必要があります)。
左側のナビゲーションウィンドウで、[バッチパイプライン] をクリックします。次に、[バッチパイプライン] リストから、開発する オフライン パイプライン を選択して、構成ページにアクセスします。
[コンポーネントライブラリ] パネルを開くには、ページの右上隅にある [コンポーネントライブラリ] をクリックします。
[コンポーネントライブラリ] パネルの左側のナビゲーションウィンドウで、[入力] を選択します。次に、右側の入力ウィジェットリスト内にある [maxcompute] コンポーネントを見つけて、キャンバスにドラッグします。
MaxCompute 入力ウィジェットカードの
アイコンをクリックして、[maxcompute] [入力構成] ダイアログボックスを開きます。[maxcompute 入力構成] ダイアログボックスで、必要なパラメーターを構成できます。
パラメーター
説明
[ステップ名]
これは MaxCompute 入力ウィジェットの名前です。Dataphin はステップ名を自動的に生成しますが、ビジネスシナリオに基づいて変更できます。命名規則は次のとおりです。
日本語、英字、アンダースコア (_)、数字のみ使用できます。
64 文字を超えることはできません。
[データソース]
データソースドロップダウンリストには、リードスルー権限を持つデータソースと持たないデータソースを含む、すべての MaxCompute タイプのデータソースが表示されます。
アイコンをクリックして、現在のデータソース名をコピーします。説明コンピューティングエンジンが MaxCompute の場合、論理テーブルを選択し、統合のために [論理テーブル入力ウィジェット] に切り替えることができます。
リードスルー権限のないデータソースの場合、データソースの後にリクエストボタンをクリックして、データソースのリードスルー権限をリクエストできます。詳細については、「データソース権限をリクエストする」をご参照ください。
MaxCompute タイプのデータソースをまだ持っていない場合は、[作成] をクリックしてデータソースを作成します。詳細については、「MaxCompute データソースを作成する」をご参照ください。
[テーブル]
データ同期のソーステーブルを選択します。テーブル名キーワードを入力して検索するか、正確なテーブル名を入力して、[完全一致検索] をクリックします。テーブルを選択すると、システムは自動的にテーブルステータスの検出を実行します。
アイコンをクリックして、現在選択されているテーブルの名前をコピーします。[パーティション]
選択したテーブルがパーティションテーブルの場合、パーティション情報を入力する必要があります。静的パーティション または範囲パーティションの読み取りをサポートします。
ds=20230101またはds1=2023,ds2=01などの静的パーティション。/*query*/ds >=20230101 and ds <= 20230107などの範囲パーティション。[パーティションが存在しない場合]
指定されたパーティションが存在しない場合の処理ポリシーとして、以下を選択できます。
[タスクを失敗に設定]: タスクを終了し、失敗に設定します。
[タスクを成功に設定、データは書き込まれません]: タスクは正常に実行されますが、データは書き込まれません。
[最新の空でないパーティションを使用]: テーブルの最新の空でないパーティション (max_pt) を同期するパーティションとして使用します。テーブルにデータを含むパーティションがない場合、タスクはエラーを報告し、失敗に設定されます。
[出力フィールド]
出力フィールド領域には、選択したテーブルのすべてのフィールド情報が表示されます。特定のフィールドをダウンストリームウィジェットに出力する必要がない場合は、対応するフィールドを削除できます。
説明コンピューティングエンジンが MaxCompute の場合、MaxCompute 入力ウィジェットの出力フィールドでは、フィールドの分類と等級の表示がサポートされています。MaxCompute 以外のコンピューティングエンジンでは、これはサポートされていません。
単一フィールド削除シナリオ: 少数のフィールドを削除する必要がある場合は、操作列の
アイコンをクリックして、余分なフィールドを削除できます。バッチフィールド削除シナリオ: 多くのフィールドを削除する必要がある場合は、[フィールド管理] をクリックし、[フィールド管理] ダイアログボックスで複数のフィールドを選択し、
左シフトアイコンをクリックして、選択した入力フィールドを未選択の入力フィールドに移動し、[確認] をクリックして、フィールドのバッチ削除を完了します。
[確認] をクリックして、MaxCompute 入力ウィジェットのプロパティ構成を完了します。