すべてのプロダクト
Search
ドキュメントセンター

Dataphin:Easysearch 入力コンポーネントの設定

最終更新日:Nov 19, 2025

Easysearch 入力コンポーネントは、Easysearch データソースからデータを読み取ります。Easysearch データソースから別のデータソースにデータを同期するには、まず Easysearch 入力コンポーネントを設定してソースデータを読み取る必要があります。このトピックでは、Easysearch 入力コンポーネントの設定方法について説明します。

前提条件

  • Easysearch データソースが作成されていること。詳細については、「Easysearch データソースの作成」をご参照ください。

  • Easysearch 入力コンポーネントの設定に使用するアカウントには、データソースに対するリードスルー権限が必要です。アカウントに必要な権限がない場合は、リクエストする必要があります。詳細については、「データソース権限のリクエスト」をご参照ください。

手順

  1. Dataphin ホームページの上部のメニューバーで、[開発] > [データ統合] を選択します。

  2. データ統合ページで、上部のメニューバーから [プロジェクト] を選択します。Dev-Prod モードでは、環境も選択する必要があります。

  3. 左側のナビゲーションウィンドウで、[バッチパイプライン] をクリックします。[バッチパイプライン] リストで、設定するオフラインパイプラインをクリックして、その設定ページを開きます。

  4. ページの右上隅にある [コンポーネントライブラリ] をクリックして、[コンポーネントライブラリ] パネルを開きます。

  5. [コンポーネントライブラリ] パネルの左側のナビゲーションウィンドウで、[入力] を選択します。入力コンポーネントのリストから [Easysearch] コンポーネントを見つけて、キャンバスにドラッグします。

  6. Easysearch 入力コンポーネントで、image アイコンをクリックして [Easysearch] [入力設定] ダイアログボックスを開きます。

  7. [Easysearch 入力設定] ダイアログボックスで、パラメーターを設定します。

    パラメーター

    説明

    基本設定

    ステップ名

    Easysearch 入力コンポーネントの名前。Dataphin はステップ名を自動的に生成します。必要に応じて変更することもできます。命名規則は次のとおりです。

    • 中国語の文字、英字、アンダースコア (_)、数字のみを含めることができます。

    • 長さは 64 文字を超えることはできません。

    データソース

    ドロップダウンリストには、現在の Dataphin インスタンス内のすべての Easysearch データソースとプロジェクトレベルが表示されます。これには、リードスルー権限があるデータソースとないデータソースが含まれます。image アイコンをクリックして、現在のデータソース名をコピーします。

    • リードスルー権限のないデータソースの場合は、データソースの横にある [リクエスト] をクリックして権限をリクエストします。詳細については、「データソース権限のリクエスト」をご参照ください。

    • Easysearch データソースがない場合は、[作成] をクリックして作成します。詳細については、「Easysearch データソースの作成」をご参照ください。

    インデックスドキュメント

    Easysearch のインデックスの名前。選択したインデックスドキュメントの名前をコピーするには、image アイコンをクリックします。

    クエリ条件

    Easysearch のクエリパラメーター。完全クエリまたは増分クエリに使用します。たとえば、{ "match_all": {}} は完全クエリを実行します。

    カーソル時間

    スクロールコンテキストを維持する期間。これは Easysearch のページングパラメーターです。

    • この値が小さすぎ、2 つのデータフェッチ間のアイドル時間がスクロール時間を超えると、スクロールコンテキストは有効期限切れになります。これにより、データが失われる可能性があります。

    • この値が大きすぎ、同時に開始されるクエリが多すぎると、開いているスクロールコンテキストの数がサーバーの max_open_scroll_context 設定を超える可能性があります。これにより、クエリエラーが発生します。たとえば、`5m` は 5 分のスクロール時間を指定します。

    単位: d (日)、h (時間)、m (分)、s (秒)、ms (ミリ秒)、micros (マイクロ秒)、nanos (ナノ秒)。

    詳細設定

    バッチサイズ

    一度に読み取るレコード数。デフォルト値は 1024 です。ソースデータベースから読み取る際に、一度に 1 レコードずつ読み取るのではなく、特定のバッチサイズを設定できます。これにより、データソースとのやり取りが減り、I/O 効率が向上し、ネットワーク遅延が低減します。

    接続タイムアウト

    クライアントの接続タイムアウト。デフォルト値は 60000 ミリ秒です。

    読み取りタイムアウト

    クライアントの読み取りタイムアウト。デフォルト値は 60000 ミリ秒です。

    日付フォーマット

    同期するフィールドが日付型で、その mappingformat 設定がない場合は、dateFormat パラメーターを設定する必要があります。Easysearch のデフォルトのフォーマットは yyyy-MM-dd'T'HH:mm:ssZ です。

    出力フィールド

    出力フィールドを表示します。

    • フィールドの一括追加。

      1. [一括追加] をクリックします。

        • JSON フォーマットで設定します。以下に例を示します。

          [{"name":"col_integer","type":"integer"},
           {"name":"col_long","type":"long"},
           {"name":"col_double","type":"double"}]
          説明

          `name` はインポートされたフィールドの名前で、`type` はインポート後のフィールドのデータの型です。たとえば、"name":"user_id","type":"String" は `user_id` という名前のフィールドをインポートし、そのデータの型を String に設定します。

        • TEXT フォーマットで設定します。以下に例を示します。

          col_long,long
          col_double,double
          • 行区切り文字は、各フィールドの情報を区切ります。デフォルトのデリミタは改行 (\n) です。セミコロン (;) とピリオド (.) もサポートされています。

          • 列区切り文字は、フィールド名とフィールドタイプを区切ります。デフォルトのデリミタはカンマ (,) です。

      2. [OK] をクリックします。

    • 出力フィールドの作成

      [出力フィールドの作成] をクリックし、プロンプトに従って [列] を入力し、[タイプ] を選択します。

    • 出力フィールドの管理。

      追加されたフィールドに対して、次の操作を実行できます。

      • [列] の横にある image 移動アイコンをドラッグすると、フィールドの位置を変更できます。

      • 既存のフィールドを編集するには、[操作] 列の編集アイコン agag をクリックします。

      • [操作] 列の agfag 削除アイコンをクリックして、既存のフィールドを削除します。

  8. [確認] をクリックして、Easysearch 入力コンポーネントのプロパティ設定を完了します。