DataHub リーダーは、DataHub SDK を使用して DataHub からリアルタイムでデータを読み取ります。
背景情報
DataHub リーダーは、起動後も実行を続け、新しいデータが DataHub に格納されると DataHub からデータを読み取ります。DataHub リーダーは、次の機能を提供します。
リアルタイムでデータを読み取ります。
DataHub のシャード数に基づいてデータを並列で読み取ります。
手順
DataWorks コンソール ページに移動します。
DataWorks コンソール にログオンします。 上部のナビゲーションバーで、目的のリージョンを選択します。 左側のナビゲーションウィンドウで、 を選択します。 表示されたページで、ドロップダウンリストから目的のワークスペースを選択し、[データ開発に移動] をクリックします。
アイコンにマウスを合わせ、 をクリックします。
ビジネスフローを展開するには、目的のビジネスフローを右クリックし、
を選択します。[ノードの作成] ダイアログボックスで、[同期方法] を [単一テーブル(トピック)から単一テーブル(トピック)への ETL] として選択し、[名前] を入力し、[パス] を選択します。
[確認] をクリックします。
リアルタイム同期ノードの構成タブで、DataHub[入力] セクションの を右側のキャンバスにドラッグします。
[datahub] ノードをクリックします。 表示される構成パネルで、パラメーターを構成します。
パラメーター
説明
データソース
DataWorks に追加した DataHub の名前。 DataHub データソースのみを選択できます。
使用可能なデータソースがない場合は、右側の [新しいデータソース] をクリックして、[管理センター] の [データソース] ページに移動し、DataHub データソースを追加します。 詳細については、「DataHubデータソース」をご参照ください。
トピック
データを同期する DataHub トピックの名前。 右側の [データプレビュー] をクリックして、選択したトピックをプレビューできます。
サブスクリプション機能の使用
サブスクリプション機能の使用 をオンにすると、サブスクリプション ID が自動的に生成されます。 DataHub のデータは、サブスクリプション ID に基づいてサブスクライブされます。 これにより、安定性とパフォーマンスが向上します。 使用中のサブスクリプション ID を DataHub から削除しないことをお勧めします。 使用中のサブスクリプション ID を DataHub から削除すると、関連するタスクが失敗します。
出力フィールド
データを同期するフィールド。
リアルタイム同期ノードの構成タブの上部ツールバーにある
アイコンをクリックして、ノードを保存します。