全部产品
Search
文档中心

MaxCompute:Gunakan DataWorks (offline dan real-time)

更新时间:Dec 06, 2025

Anda dapat menggunakan fitur Data Integration dari DataWorks untuk mengimpor data dari sumber data lain ke MaxCompute dalam mode batch atau real-time, serta mengimpor berbagai jenis file lokal. Topik ini menjelaskan cara menggunakan DataWorks untuk mengimpor data ke MaxCompute.

Prosedur

  1. Buat proyek MaxCompute dan tabel. Tabel tersebut menyimpan data yang Anda sinkronkan ke MaxCompute.

  2. Buat ruang kerja DataWorks dan sambungkan resource komputasi MaxCompute.

  3. Impor data.

    Impor file lokal ke MaxCompute

    1. Masuk ke Konsol DataWorks dan pilih Wilayah di pojok kiri atas.

    2. Pada panel navigasi kiri, pilih Data Integration > Data Upload and Download.

    3. Pada panel navigasi kiri, klik ikon upload image lalu klik Upload Data.

    4. Ikuti petunjuk pada layar untuk mengupload data target.

      Anda dapat mengimpor file CSV, XLS, XLSX, dan JSON ke MaxCompute menggunakan opsi impor Local File atau OSS:

      • Local File: Ukuran maksimum file adalah 5 GB untuk file CSV dan 100 MB untuk jenis file lainnya.

      • OSS: Anda hanya dapat mengupload data dari Bucket yang berada di Wilayah yang sama dengan proyek MaxCompute saat ini.

    Untuk informasi selengkapnya, lihat Upload data.

    Untuk versi ruang kerja DataWorks yang lebih lama, Anda dapat mengupload file CSV lokal atau file teks kustom ke tabel MaxCompute. Untuk informasi selengkapnya, lihat Upload data.

    Impor data dari sumber data lain ke MaxCompute

    1. Masuk ke Konsol DataWorks dan pilih Wilayah di pojok kiri atas.

    2. Pada panel navigasi kiri, pilih Data Development and O&M > Data Development.

    3. Pada bagian Select Workspace, klik Go To DataStudio.

    4. Pada panel kiri DataStudio, klik ikon image lalu pilih Create Node > Data Integration > Batch Synchronization atau Real-time Synchronization.

      • Batch Synchronization Node: Atur tujuan data ke MaxCompute dan sumber data ke sumber data lain.

      • Real-time synchronization node: Atur output ke MaxCompute dan input ke sumber data lain.

      Untuk informasi selengkapnya, lihat Konfigurasikan node di antarmuka tanpa kode, Konfigurasikan node di editor kode, dan Konfigurasikan tugas sinkronisasi real-time di DataStudio.

    5. Kembali ke Konsol DataWorks.

      Pada panel navigasi kiri, pilih Data Integration > Data Integration.

    6. Pada panel navigasi kiri, pilih Sync Task, klik Create Synchronization Task, lalu konfigurasikan informasi sumber data di kotak dialog Create Sync Task.

      Untuk informasi selengkapnya, lihat Konfigurasikan tugas sinkronisasi real-time untuk seluruh database.

Fitur sinkronisasi Data Integration

Data Integration DataWorks mendukung sinkronisasi data dari sumber data lain ke MaxCompute. Misalnya, Anda dapat menyinkronkan data dari database seperti ApsaraDB RDS ke MaxCompute. Prinsip sinkronisasi dan fitur yang didukung bervariasi tergantung pada skenario.

  • Batch synchronization menyediakan plugin Reader dan Writer untuk membaca dan menulis data ke sumber data.

    • Dalam skenario impor batch, setiap node sinkronisasi batch dapat mengimpor data dari satu atau beberapa tabel ke satu tabel MaxCompute.

  • Real-time synchronization mendukung penggabungan berbagai sumber data input dan output untuk membuat tautan sinkronisasi. Tautan ini dapat melakukan sinkronisasi inkremental real-time untuk satu tabel atau seluruh database.

  • Data Integration juga menyediakan solusi sinkronisasi untuk berbagai skenario yang melibatkan sumber data berbeda. Solusi ini mendukung skenario seperti sinkronisasi batch untuk seluruh database serta sinkronisasi real-time penuh dan inkremental.

Tabel berikut menjelaskan fitur sinkronisasi data yang didukung untuk MaxCompute.

Sinkronisasi offline

Sinkronisasi Real-time

Solusi Sinkronisasi

Read from single table

Write to single table

Read incremental data from single table

Write incremental data to single table

Read incremental data from entire database

Write incremental data to entire database

Read from entire database (batch)

Write to entire database (batch)

Read full and incremental data from single table/entire database (real-time)

Write full and incremental data to single table/entire database (real-time)

image..png

image..png

-

image..png

-

image..png

-

image..png

-

image..png

Untuk informasi selengkapnya tentang fitur sinkronisasi data yang disediakan Data Integration DataWorks untuk MaxCompute, lihat Sumber data MaxCompute.

Penagihan

Untuk menggunakan Data Integration DataWorks dalam sinkronisasi data, Anda perlu menggunakan kelompok sumber daya Data Integration dan kelompok sumber daya penjadwalan. Anda dapat menggunakan kelompok sumber daya bersama atau eksklusif sesuai kebutuhan. Jika data ditransfer melalui Internet, Anda mungkin dikenai biaya transfer data.

Praktik terbaik

Sinkronisasi batch seluruh database ke MaxCompute

Sinkronisasi batch data inkremental dari database ke MaxCompute

Sinkronisasi database dan tabel terpartisi ke MaxCompute

Sinkronisasi real-time data penuh dan inkremental dari database ke MaxCompute