すべてのプロダクト
Search
ドキュメントセンター

Dataphin:StarRocks 入力コンポーネントを構成する

最終更新日:Feb 06, 2025

StarRocks 入力コンポーネントを使用すると、StarRocks データソースからデータを読み取ることができます。StarRocks データソースから他の宛先にデータを同期する場合、同期用のターゲットデータソースを設定する前に、StarRocks 入力コンポーネントによって読み取られるソースを構成する必要があります。このトピックでは、StarRocks 入力コンポーネントの構成プロセスについて説明します。

前提条件

手順

  1. Dataphin ホームページで、トップメニューバーに移動し、[開発] > [data Integration] を選択します。

  2. 統合ページの上部で、プロジェクト を選択します(開発-本番モードでは環境を選択する必要があります)。

  3. 左側のナビゲーションウィンドウで、[バッチパイプライン] をクリックします。[バッチパイプライン] リストから、開発する オフライン パイプライン を選択して、構成ページにアクセスします。

  4. 右上隅にある [コンポーネントライブラリ] をクリックして、[コンポーネントライブラリ] パネルを開きます。

  5. [コンポーネントライブラリ] パネルの左側のナビゲーションウィンドウで、[入力] を選択します。右側のリストで [starrocks] コンポーネントを見つけて、キャンバスにドラッグします。

  6. コンポーネントを構成するには、StarRocks 入力コンポーネントカードの image アイコンをクリックして、[starrocks 入力構成] ダイアログボックスを開きます。

  7. [starrocks 入力構成] ダイアログボックスで、次のパラメーターを設定します。

    パラメーター

    説明

    [ステップ名]

    これは StarRocks 入力コンポーネントの名前です。Dataphin はステップ名を自動的に生成しますが、ビジネスシナリオに応じて変更できます。命名規則は次のとおりです。

    • 漢字、英字、アンダースコア(_)、数字のみ使用できます。

    • 64 文字を超えることはできません。

    [データソース]

    データソースドロップダウンリストには、現在の Dataphin 内のすべての StarRocks タイプのデータソースが表示されます。これには、リードスルー権限を持つデータソースと、リードスルー権限を持たないデータソースが含まれます。image アイコンをクリックして、現在のデータソース名をコピーします。

    • リードスルー権限のないデータソースの場合、データソースの後に [リクエスト] をクリックして、データソースのリードスルー権限をリクエストできます。具体的な操作については、「データソース権限をリクエストする」をご参照ください。

    • StarRocks タイプのデータソースがない場合は、[データソースの作成] をクリックしてデータソースを作成します。詳細については、「StarRocks データソースを作成する」をご参照ください。

    [ソーステーブルボリューム]

    ソーステーブルボリュームを選択します。ソーステーブルボリュームには、[単一テーブル][複数テーブル] が含まれます。

    • [単一テーブル]: 1 つのテーブルのビジネスデータを 1 つのターゲットテーブルに同期するシナリオに適しています。

    • [複数テーブル]: 複数テーブルのビジネスデータを同じターゲットテーブルに同期するシナリオに適しています。複数テーブルのデータを同じデータテーブルに書き込む場合、UNION アルゴリズムが使用されます。

    [テーブル]

    ソーステーブルを選択します。

    • ソース テーブル ボリューム単一のテーブル に設定されている場合は、テーブル名のキーワードを入力して検索するか、正確なテーブル名を入力して [精密検索] をクリックします。テーブルを選択すると、システムは自動的にテーブル ステータス検出を実行します。image アイコンをクリックして、現在選択されているテーブルの名前をコピーします。

    • ソース テーブルのボリューム複数のテーブル に設定されている場合は、次の操作を実行してテーブルを追加します。

      1. 入力ボックスに、同じ構造のテーブルをフィルタリングするためのテーブルの式を入力します。

        システムは、列挙形式、クラス正規表現形式、およびその 2 つの混合形式をサポートしています。例:table_[001-100];table_102

      2. [正確な検索] をクリックして、[一致の詳細を確認] ダイアログボックスに一致するテーブルのリストを表示します。

      3. [確認] をクリックします。

    [シャードキー](オプション)

    ソースデータテーブルの 整数 型の列をシャードキーとして使用できます。 プライマリキー、または インデックス が設定された列をシャードキーとして使用することをお勧めします。データを読み取るときは、構成されたシャードキーフィールドに基づいてデータシャーディングが実行され、同時読み取りが実現し、データ同期の効率が向上します。

    [バッチ読み取りカウント](オプション)

    一度に読み取るデータエントリの数。ソースデータベースからデータを読み取るときに、1 つずつ読み取る代わりに特定のバッチ読み取りカウント(1024 レコードなど)を構成して、データソースとの対話の回数を減らし、I/O 効率を向上させ、ネットワークレイテンシを削減できます。

    [入力フィルター](オプション)

    ds=${bizdate} などの入力フィールドのフィルター情報を入力します。 [入力フィルター] は、次の 2 つのシナリオに適用できます。

    • データの固定部分。

    • パラメーターフィルタリング。

    [出力フィールド]

    出力フィールド領域には、選択したテーブルのすべてのフィールドと、フィルター条件に一致したフィールドが表示されます。新しい出力フィールドを作成したり、出力フィールドを一括で追加したりできます。特定のフィールドをダウンストリームコンポーネントに出力する必要がない場合は、対応するフィールドを削除することもできます。

    • [一括追加]: [一括追加] をクリックすると、JSON、TEXT 形式、または DDL 形式での一括構成がサポートされます.

      説明

      一括追加が完了した後、確認をクリックすると、構成済みのフィールド情報が 上書き されます。

      • JSON 形式での一括構成。例:

        // 例:
        [{
          "name": "user_id",
          "type": "String"
         },
         {
          "name": "user_name",
          "type": "String"
         }]
        説明

        name は導入されたフィールドの名前を表し、type は導入後のフィールドのタイプを表します。たとえば、"name":"user_id","type":"String" は、user_id という名前のフィールドが導入され、フィールドタイプが String に設定されていることを示します。

      • TEXT 形式での一括構成。例:

        // 例:
        user_id,String
        user_name,String
        • 行区切り文字は、各フィールドの情報を区切るために使用されます。デフォルトは改行(\n)で、改行(\n)、セミコロン(;)、ピリオド(.)をサポートしています。

        • 列区切り文字は、フィールド名とフィールドタイプを区切るために使用されます。デフォルトはカンマ(,)です。

      • DDL 形式での一括構成。例:

        CREATE TABLE tablename (
            id INT PRIMARY KEY,
            name VARCHAR(50),
            age INT
        );
    • [新しい出力フィールドの作成]: [+ 新しい出力フィールドを作成] をクリックし、ページのプロンプトに従って [列] を入力し、[タイプ] を選択します。

    • 単一フィールドの削除: 少数のフィールドを削除する必要がある場合は、出力フィールドリストで対象フィールドの [アクション] 列をクリックし、sgaga アイコンをクリックして冗長フィールドを削除します。

      説明

      コンピューティングエンジンが StarRocks の場合、StarRocks 入力コンポーネントの出力フィールドでは、フィールドの分類と等級を表示できます。StarRocks 以外のコンピューティングエンジンでは、これはサポートされていません。

    • 一括削除フィールド: 多くのフィールドを削除する必要がある場合は、[フィールド管理] をクリックし、[フィールド管理] ダイアログボックスで複数のフィールドを選択し、image 左移動アイコンをクリックして選択した入力フィールドを選択されていない入力フィールドに移動し、[確認] をクリックしてフィールドの一括削除を完了します。

      image..png

  8. [確認] をクリックして、[starrocks 入力コンポーネント] のプロパティ構成を確定します。