すべてのプロダクト
Search
ドキュメントセンター

DataWorks:DataHub Writer の構成

最終更新日:Mar 17, 2025

DataHub は、ストリーミングデータを処理するために設計されたプラットフォームです。 DataHub でストリーミングデータを公開およびサブスクライブし、他のプラットフォームに配布できます。 DataHub を使用すると、ストリーミングデータを分析し、ストリーミングデータに基づいてアプリケーションを構築できます。

前提条件

リーダーノードまたは変換ノードが構成されています。 詳細については、「リアルタイム同期をサポートするデータソースの種類」をご参照ください。

背景情報

DataHub Writer は、Java 用 DataHub SDK を使用して DataHub にデータを書き込みます。 次のコードは、Java 用 DataHub SDK のバージョンを示しています。

<dependency>
    <groupId>com.aliyun.datahub</groupId>
    <artifactId>aliyun-sdk-datahub</artifactId>
    <version>2.5.1</version>
</dependency>

手順

  1. DataStudio ページに移動します。

    DataWorks コンソール にログオンします。 上部のナビゲーションバーで、目的のリージョンを選択します。 左側のナビゲーションウィンドウで、[データ開発と O&M] > [データ開発] を選択します。 表示されるページで、ドロップダウンリストから目的のワークスペースを選択し、[データ開発に移動] をクリックします。

  2. 新建 アイコンにマウスポインターを合わせて、[ノードの作成] > [data Integration] > [リアルタイム同期] をクリックします。

    または、ビジネスフローを展開し、ターゲットビジネスフローを右クリックして、[ノードの作成] > [data Integration] > [リアルタイム同期] を選択します。

  3. [ノードの作成] ダイアログボックスで、[同期方法][単一テーブル(トピック)から単一テーブル(トピック)への ETL] として選択し、[名前] を入力し、[パス] を選択します。

  4. [確認] をクリックします。

  5. リアルタイム同期ノードの構成タブで、DataHub[出力] セクションの を右側のキャンバスにドラッグし、DataHub ノードをリーダーノードまたは変換ノードに接続します。

  6. [datahub] ノードをクリックします。 表示される構成パネルで、パラメーターを構成します。

    image

    パラメーター

    説明

    データソース

    DataWorks に追加した DataHub データソースの名前。 DataHub データソースのみを選択できます。

    データソースがない場合は、右側の [新しいデータソース] をクリックして、[データソース] ページの [管理センター] に移動し、DataHub データソースを追加します。 詳細については、「DataHub データソースの追加」をご参照ください。

    トピック

    データを書き込む DataHub トピックの名前。 右側の [データプレビュー] をクリックして、選択したトピックをプレビューできます。

    書き込みモード

    DataHub トピックにデータを書き込むモード。 有効な値:

    タプル: データは構造化データとして DataHub トピックに書き込まれます。 このモードでは、スキーマに基づいて DataHub が作成されている必要があります。

    BLOB: データは非構造化データとして DataHub トピックに書き込まれます。 このモードでは、DataHub トピックが BLOB タイプであり、DataHub トピックに書き込まれるデータがバイナリデータのチャンクとして保存されている必要があります。

    バッチ数

    一度に書き込むデータレコードの数。

    マッピング

    ソースとデスティネーションのフィールド間のマッピング。 DataWorks は、フィールドマッピングに基づいてデータを同期します。

  7. リアルタイム同期ノードの構成タブの上部ツールバーにある 保存 アイコンをクリックして、ノードを保存します。