全部产品
Search
文档中心

DataWorks:Sinkronkan data ke MaxCompute

更新时间:Feb 05, 2026

Node Sinkronisasi Data ke MaxCompute di DataWorks memungkinkan Anda memigrasikan data dari tabel internal Hologres ke MaxCompute untuk penyimpanan big data yang efisien. Topik ini menjelaskan proses konfigurasi agar Anda dapat dengan mudah memigrasikan data dan memanfaatkan sepenuhnya pemrosesan berkinerja tinggi MaxCompute.

Prasyarat

Batasan

Konfigurasikan node sinkronisasi

Pada halaman pengeditan node, konfigurasikan sebagai berikut.

Konfigurasikan sumber Hologres

Gunakan deskripsi parameter berikut untuk memilih dan mengonfigurasi tabel sumber Hologres.

Parameter

Deskripsi

Source Object Type

Default-nya adalah Hologres Table.

Data Source

Pilih Compute Resource Hologres yang berisi data sumber.

Instance

ID Instance Hologres. Sistem akan mengisi nilai ini secara otomatis.

Database

Pilih Database Hologres yang ingin Anda sinkronkan.

Schema

Pilih schema yang ingin Anda sinkronkan.

Table

Pilih nama tabel yang ingin Anda sinkronkan.

Filter

Sistem secara otomatis menghasilkan Filter berdasarkan tabel partisi Anda. Anda dapat menyesuaikannya sesuai kebutuhan. Hanya data yang memenuhi kriteria Filter yang akan disinkronkan.

Catatan

Filter ini sesuai dengan klausa WHERE dalam Pernyataan SQL.

Konfigurasikan tujuan MaxCompute

Gunakan deskripsi parameter berikut untuk mengonfigurasi tabel tujuan MaxCompute.

Parameter

Deskripsi

Data Source

Pilih Compute Resource MaxCompute target untuk sinkronisasi.

Project

Proyek MaxCompute yang sesuai dengan Data Source. Sistem akan mengisi nilai ini secara otomatis.

Schema

Pilih schema tempat Anda ingin menyimpan data. Parameter ini wajib diisi untuk Proyek MaxCompute yang telah mengaktifkan model tiga lapis. Parameter ini tidak tersedia untuk proyek yang belum mengaktifkan model tiga lapis.

Table

Tentukan nama kustom untuk Tabel Internal MaxCompute.

Lifecycle

Atur Lifecycle tabel. Jika data dalam tabel tidak dimodifikasi dalam periode yang ditentukan, MaxCompute akan secara otomatis mereklaim tabel tersebut.

Field

Fields to Synchronize

Pilih bidang yang ingin Anda sinkronkan dan atur Tipe Datanya di tabel Tujuan MaxCompute.

Partition Settings

Anda dapat menyesuaikan Kunci Partisi untuk Tabel Internal MaxCompute. Data partisi dapat berasal dari cara-cara berikut:

  • Hologres Field: Pilih bidang dari tabel Sumber Hologres untuk digunakan sebagai Kunci Partisi.

  • Scheduling Parameter: Gunakan parameter penjadwalan untuk menentukan Kunci Partisi.

Konfigurasikan pengaturan sinkronisasi

Pada bagian Data Synchronization Settings, konfigurasikan metode impor dan izin akses Instance Hologres. Tabel berikut menjelaskan parameter-parameternya.

Parameter

Deskripsi

Import Method

Untuk mengimpor data, pilih salah satu metode berikut:

  • Overwrite: Menghapus data yang ada dan menulis data baru ke tabel tujuan.

  • Append: Mempertahankan data yang ada dan menambahkan data baru ke tabel tujuan.

Hologres Access Permission

Untuk mengakses Instance Hologres, pilih salah satu metode berikut:

  • Double-signature access mode: Memverifikasi izin Hologres menggunakan identitas saat ini.

    Anda harus memiliki izin baca pada tabel MaxCompute dan izin pada tabel Sumber Hologres yang sesuai dalam Proyek MaxCompute. Untuk informasi lebih lanjut tentang kontrol izin di sisi MaxCompute, lihat Panduan pengguna Solusi Data Lakehouse 2.0. Untuk informasi lebih lanjut tentang kontrol izin di sisi Hologres, lihat Ikhtisar manajemen izin.

  • RAM Role-based Access Mode: Memverifikasi identitas akses menggunakan Peran RAM tertentu.

    Berikan kebijakan izin AliyunSTSAssumeRoleAccess ke Peran RAM. Untuk informasi selengkapnya, lihat mode otorisasi Peran RAM. Setelah memberikan izin tersebut, tentukan Peran RAM di bidang RAM Role.

Location

Selama proses sinkronisasi, sistem secara otomatis membuat tabel MaxCompute berdasarkan path penyimpanan eksternal Hologres. Anda dapat menggunakan path penyimpanan default yang dihasilkan sistem atau menentukan path penyimpanan eksternal Hologres kustom.

Debug node sinkronisasi

Untuk melakukan debug dan menjalankan node, konfigurasikan informasi debugging sesuai kebutuhan.

  1. Konfigurasikan properti untuk debugging node.

    Pada panel kanan Run Configuration di editor node, konfigurasikan informasi Compute Resource dan Resource Group. Tabel berikut menjelaskan parameter-parameternya.

    Parameter

    Deskripsi

    Compute Resource

    Pilih Compute Resource MaxCompute yang telah diikat.

    Computing Quota

    Pilih kuota komputasi yang dihasilkan saat Anda membuat Proyek MaxCompute, atau klik Create Computing Quota di bagian bawah daftar drop-down untuk membuat yang baru. Untuk informasi lebih lanjut, lihat Kelola kuota komputasi.

    Resource Group

    Pilih Resource Group yang telah berhasil lulus uji konektivitas saat Anda mengikat Compute Resource MaxCompute.

    Compute CU

    Node menggunakan nilai CU default. Tidak perlu modifikasi.

    Scheduling Parameters

    Jika Anda mendefinisikan variabel dalam Filter menggunakan format ${Parameter Name}, Anda harus mengonfigurasi Parameter Name dan Parameter Value di bagian Scheduling Parameters. Saat waktu proses, variabel tersebut akan diganti secara dinamis dengan nilai aktualnya. Untuk informasi lebih lanjut, lihat Konfigurasi penjadwalan node.

  2. Untuk melakukan debug dan menjalankan tugas node, klik Save lalu Run.

Langkah selanjutnya

  • Konfigurasi penjadwalan node:Jika node dalam direktori Proyek perlu dijalankan secara berkala, Anda harus mengonfigurasi Scheduling Policy dan properti penjadwalan terkait di panel Schedule di sisi kanan editor node. Untuk informasi lebih lanjut, lihat

  • Publikasikan node:Untuk memublikasikan node, klik ikon image untuk memulai proses penerbitan. Setelah Anda memublikasikan node dalam direktori Proyek ke Lingkungan Produksi, node tersebut akan berjalan secara berkala berdasarkan konfigurasi penjadwalannya. Untuk informasi lebih lanjut, lihat

FAQ

  • Ketidaksesuaian tipe bidang: Jika Anda mengalami ketidaksesuaian tipe data selama konfigurasi, tugas sinkronisasi akan gagal. Pastikan konfigurasi tipe data bidang untuk tabel MaxCompute sudah benar.

  • Data tidak konsisten untuk satu partisi: Jika data yang disinkronkan untuk satu partisi tidak sesuai dengan data aktual, periksa apakah filter yang Anda konfigurasikan untuk sumber sudah benar.