全部产品
Search
文档中心

DataWorks:Konfigurasi DataHub Writer

更新时间:Jul 06, 2025

DataHub adalah platform yang dirancang untuk memproses data streaming. Anda dapat mempublikasikan dan berlangganan data streaming di DataHub serta mendistribusikannya ke platform lain. DataHub juga memungkinkan Anda menganalisis data streaming dan membangun aplikasi berdasarkan data tersebut.

Prasyarat

Node pembaca atau konversi telah dikonfigurasi. Untuk informasi lebih lanjut, lihat Jenis sumber data yang mendukung sinkronisasi real-time.

Informasi latar belakang

DataHub Writer menulis data ke DataHub menggunakan DataHub SDK for Java. Kode berikut menunjukkan versi dari DataHub SDK for Java.

<dependency>
    <groupId>com.aliyun.datahub</groupId>
    <artifactId>aliyun-sdk-datahub</artifactId>
    <version>2.5.1</version>
</dependency>

Prosedur

  1. Buka halaman DataStudio.

    Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi sebelah kiri, pilih Data Development and O&M > Data Development. Pada halaman yang muncul, pilih workspace yang diinginkan dari daftar drop-down dan klik Go to Data Development.

  2. Di panel Alur Kerja Terjadwal pada halaman DataStudio, gerakkan pointer di atas ikon 新建 dan pilih Create Node > Data Integration > Real-time Synchronization.

    Atau, temukan alur kerja yang diinginkan di panel Alur Kerja Terjadwal, klik kanan nama alur kerja, dan pilih Create Node > Data Integration > Real-time Synchronization.

  3. Di kotak dialog Create Node, atur parameter Sync Method menjadi End-to-end ETL dan konfigurasikan parameter Name dan Path.

  4. Klik Confirm.

  5. Pada tab konfigurasi node sinkronisasi real-time, seret DataHub di bagian Output ke kanvas di sebelah kanan dan hubungkan node DataHub ke node pembaca atau konversi.

  6. Klik node DataHub. Di panel konfigurasi yang muncul, konfigurasikan parameter-parameter yang diperlukan.

    image

    Parameter

    Deskripsi

    Data source

    Nama sumber data DataHub yang telah Anda tambahkan ke DataWorks. Anda hanya dapat memilih sumber data DataHub.

    Jika tidak ada sumber data yang tersedia, klik New data source di sebelah kanan untuk pergi ke halaman Data Sources di Management Center untuk menambahkan sumber data DataHub. Untuk informasi lebih lanjut, lihat Tambahkan sumber data DataHub.

    Topic

    Nama topik DataHub ke mana Anda ingin menulis data. Anda dapat mengklik Data preview di sebelah kanan untuk melihat pratinjau topik yang dipilih.

    Write Mode

    Mode di mana Anda ingin menulis data ke topik DataHub. Nilai yang valid:

    Tuple: Data ditulis ke topik DataHub sebagai data terstruktur. Mode ini memerlukan agar DataHub dibuat berdasarkan skema.

    Blob: Data ditulis ke topik DataHub sebagai data tidak terstruktur. Mode ini memerlukan agar topik DataHub bertipe BLOB, dan data yang ditulis ke topik DataHub disimpan sebagai chunk data biner.

    Number of batches

    Jumlah catatan data yang akan ditulis dalam satu waktu.

    Mappings

    Pemetaan antara bidang di sumber dan tujuan. DataWorks menyinkronkan data berdasarkan pemetaan bidang.

  7. Di bilah alat atas tab konfigurasi node sinkronisasi real-time, klik ikon 保存 untuk menyimpan node tersebut.