DataWorks Data Integration mengimpor data dari sumber eksternal ke MaxCompute secara batch atau real time, serta mendukung pengunggahan file lokal.
Prosedur
-
Anda telah membuat proyek MaxCompute dan membuat tabel untuk menyimpan data yang diimpor.
-
Anda telah membuat ruang kerja DataWorks dan mengaitkan resource komputasi MaxCompute.
-
Impor data.
Impor file lokal
-
Masuk ke Konsol DataWorks, lalu pilih Wilayah di pojok kiri atas.
-
Pada panel navigasi kiri, pilih .
-
Klik ikon unggah di panel navigasi kiri
, lalu klik Data Upload. -
Ikuti petunjuk di layar untuk mengunggah data Anda.
Anda dapat mengimpor file dalam format
CSV,XLS,XLSX, danJSONke MaxCompute menggunakan Local File atau OSS. Batasan:-
Local File: Ukuran maksimum file
CSVadalah 5 GB. Untuk jenis file lainnya, ukuran maksimum adalah 100 MB. -
OSS: Anda hanya dapat mengunggah data dari bucket yang berada di Wilayah yang sama dengan proyek MaxCompute Anda.
-
Untuk ruang kerja lama, unggah file CSV lokal atau file teks kustom melalui fitur Upload data.
Impor dari sumber data lain
-
Masuk ke Konsol DataWorks, lalu pilih Wilayah di pojok kiri atas.
-
Pada panel navigasi kiri, pilih .
-
Select Workspace, lalu klik 进入Data Studio.
-
Di panel kiri DataStudio, klik
, lalu pilih atau Real-time synchronization.-
Node sinkronisasi offline: Konfigurasikan tujuan data sebagai MaxCompute dan sumber data sebagai sumber data lain.
-
Node sinkronisasi real-time: Konfigurasikan output sebagai MaxCompute dan input sebagai sumber data lain.
Konfigurasikan node sinkronisasi dalam mode wizard, Konfigurasikan node sinkronisasi dalam mode skrip, dan Konfigurasikan tugas sinkronisasi real-time (tidak digunakan lagi).
-
-
Kembali ke Konsol DataWorks.
Pada panel navigasi kiri, pilih .
-
Pada panel navigasi kiri, pilih Sync Task, lalu klik Create Synchronization Task. Pada kotak dialog Create Sync Task yang muncul, konfigurasikan informasi sumber data.
Konfigurasikan tugas sinkronisasi real-time untuk seluruh database.
-
Kemampuan sinkronisasi
Data Integration menyinkronkan data dari sumber seperti database RDS ke MaxCompute. Kemampuan yang didukung bervariasi tergantung skenario.
-
Sinkronisasi batch menggunakan plugin Reader dan Writer untuk membaca dari dan menulis ke sumber data.
-
Setiap node sinkronisasi batch dapat mengimpor data dari satu atau beberapa tabel sumber ke satu tabel MaxCompute.
-
-
Sinkronisasi real-time menggabungkan beberapa sumber data input dan output menjadi tautan sinkronisasi untuk sinkronisasi inkremental real-time dari satu tabel atau seluruh database.
-
Solusi sinkronisasi mencakup skenario seperti sinkronisasi batch seluruh database dan sinkronisasi real-time penuh serta inkremental.
Tabel berikut mencantumkan kemampuan yang didukung ketika MaxCompute menjadi tujuan.
|
Sinkronisasi batch |
Sinkronisasi real-time |
Solusi sinkronisasi |
|||||||
|
Single-table read |
Single-table write |
Single-table incremental read |
Single-table incremental write |
Full-database incremental read |
Full-database incremental write |
Full-database batch read |
Full-database batch write |
Real-time full/incremental read |
Real-time full/incremental write |
|
|
|
- |
|
- |
|
- |
|
- |
|
Untuk detail tentang kemampuan sinkronisasi MaxCompute, lihat Sumber data MaxCompute.
Penagihan
Data Integration memerlukan kelompok sumber daya baik untuk integrasi data maupun penjadwalan. Anda dapat menggunakan kelompok sumber daya bersama atau eksklusif. Transfer data melalui jaringan publik dapat dikenai biaya transfer data Internet.
-
Kelompok sumber daya Data Integration: Penagihan kelompok sumber daya eksklusif berlangganan untuk Data Integration dan Kelompok sumber daya bersama pay-as-you-go untuk Data Integration (untuk debugging).
-
Transfer data Internet: Penagihan transfer data Internet.
-
Kelompok sumber daya penjadwalan: Penagihan kelompok sumber daya eksklusif berlangganan untuk penjadwalan dan Penagihan kelompok sumber daya bersama untuk penjadwalan.