DataWorks menyediakan dua mode ruang kerja—mode dasar dan mode standar—untuk memenuhi berbagai kebutuhan produksi data, keamanan, dan tata kelola. Topik ini membandingkan arsitektur serta alur kerja pengembangan pada kedua mode tersebut.
Latar Belakang
Topik ini mencakup bagian-bagian berikut:
Bagian | Deskripsi |
Menjelaskan arsitektur masing-masing mode ruang kerja. | |
Dampak mode yang berbeda terhadap pengembangan dan O&M node produksi | Menjelaskan mekanisme pengembangan dan O&M di DataWorks berdasarkan arsitektur masing-masing mode. |
Membandingkan kelebihan dan kekurangan masing-masing mode ruang kerja. | |
Menggambarkan alur kerja berbasis peran dan tata kelola dalam ruang kerja mode standar. | |
Pemetaan sumber data untuk modul DataWorks pada masing-masing mode | Menjelaskan cara modul DataWorks terhubung ke sumber data di lingkungan yang berbeda yang tersedia pada masing-masing mode. |
Memberikan panduan bagi pengguna ruang kerja mode dasar yang ingin menerapkan pemisahan antara pengembangan dan produksi. |
Catatan
Masing-masing mode ruang kerja memiliki persyaratan khusus untuk membuat sumber data. Untuk mencapai isolasi lingkungan dalam ruang kerja mode standar, buat sumber data fisik yang terpisah untuk lingkungan pengembangan dan produksi. Untuk informasi lebih lanjut tentang pembuatan sumber data dalam ruang kerja, lihat Manajemen sumber data.
Kemampuan mengakses sumber daya atau data lintas proyek atau database bergantung pada fitur sumber data itu sendiri. Jika Anda mengonfigurasi sumber data yang berbeda untuk lingkungan pengembangan dan produksi, kemampuan sumber data tersebut menentukan apakah Anda dapat mengakses tabel produksi, sumber daya, atau fungsi dari lingkungan pengembangan.
Secara default, node dalam lingkungan pengembangan mode standar tidak dijadwalkan untuk eksekusi periodik. Hanya node yang diterapkan ke lingkungan produksi yang dapat dijadwalkan secara periodik.
Pengenalan mode dasar dan mode standar
Anda dapat membuat ruang kerja dalam salah satu mode untuk menjelajahi DataWorks. Namun, untuk pekerjaan pengembangan sesungguhnya, kami sangat menyarankan menggunakan ruang kerja mode standar. Hal ini memungkinkan Anda menerapkan isolasi kode antara lingkungan pengembangan dan produksi, menggunakan sumber daya komputasi terpisah, memberlakukan kontrol izin, serta menetapkan proses penerapan node yang terkelola.
Jika Anda menggunakan ruang kerja mode dasar dan ingin mempertahankan kodenya, Anda dapat meningkatkannya ke mode standar. Untuk informasi selengkapnya, lihat Peningkatan mode ruang kerja.
Tabel berikut membandingkan ruang kerja mode dasar dan mode standar.
Aspek | Mode dasar | Mode standar (direkomendasikan) |
Jumlah sumber data | Ruang kerja mode dasar terhubung ke satu sumber data. | Satu ruang kerja DataWorks dikaitkan dengan dua sumber data, sehingga memungkinkan Anda mengisolasi sumber data untuk lingkungan pengembangan dan produksi. Catatan Untuk mencapai isolasi lingkungan, buat sumber data fisik yang terpisah untuk lingkungan pengembangan dan produksi.
|
Lingkungan DataWorks yang sesuai | Satu sumber data berfungsi sebagai lingkungan produksi untuk DataWorks. | Satu sumber data berfungsi sebagai lingkungan pengembangan DataWorks, dan yang lainnya berfungsi sebagai lingkungan produksi. Catatan Anda dapat mengonfigurasi jenis sumber data yang berbeda untuk masing-masing lingkungan. Misalnya:
|
Dampak mode yang berbeda terhadap pengembangan dan O&M node produksi
Perbandingan | Mode Dasar | Mode Standar (Direkomendasikan) |
Kontrol atas alur kerja pengembangan node produksi | Setelah node diajukan, sistem penjadwalan dapat segera menjalankannya secara periodik untuk menghasilkan data keluaran. Tidak diperlukan langkah penerapan. (Ajukan → Produksi)
| Node harus terlebih dahulu diajukan ke lingkungan pengembangan. Kemudian, node tersebut harus diterapkan ke lingkungan produksi sebelum dapat dijadwalkan dan dijalankan secara otomatis. (Ajukan → Terapkan → Produksi) Catatan Dalam mode standar, hanya node di lingkungan produksi yang dijadwalkan secara otomatis.
|
Kontrol atas izin O&M untuk node produksi | Pengembang dapat langsung mengedit kode node produksi. | Pengembang hanya dapat mengedit dan mengajukan kode di Data Studio. Mereka tidak dapat langsung menerapkan kode ke lingkungan produksi. Penerapan ke lingkungan produksi memerlukan izin O&M, yang dimiliki oleh peran seperti Pemilik Ruang Kerja, Administrator, dan O&M.
|
Kontrol atas izin data produksi | Pengembang dapat langsung menggunakan data produksi untuk pengujian, yang menimbulkan risiko terhadap keamanan data. | Di lingkungan pengembangan, pengembang dapat menggunakan data uji untuk pengujian. Mereka juga dapat diberikan atau mengajukan izin untuk menggunakan data tabel produksi guna verifikasi. Catatan
|
Perbedaan identitas akses data | Identitas tunggal digunakan untuk langsung mengoperasikan lingkungan produksi. Untuk MaxCompute, Hologres, EMR, dan CDH, identitas akses dapat berupa Akun Alibaba Cloud, Pengguna RAM, Peran RAM (hanya MaxCompute), atau pemilik node. Catatan Untuk mesin komputasi lainnya, seperti AnalyticDB for MySQL dan AnalyticDB for PostgreSQL, identitas akses bergantung pada akun yang Anda ikat saat membuat sumber data. Izinnya konsisten dengan izin akun tersebut di database. |
Catatan Untuk MaxCompute, Hologres, EMR, dan CDH:
Untuk mesin komputasi lainnya, seperti AnalyticDB for MySQL dan AnalyticDB for PostgreSQL, identitas akses bergantung pada akun yang Anda ikatkan ke masing-masing lingkungan saat membuat sumber data. Izinnya konsisten dengan izin akun tersebut di database. |
Perbandingan kelebihan dan kekurangan masing-masing mode
Aspek | Mode dasar | Mode standar |
Kelebihan | Sederhana dan mudah digunakan. Anda hanya perlu memberikan peran pengembang kepada pengembang untuk melakukan semua tugas pengembangan gudang data. | Aman dan terkelola dengan baik.
|
Kekurangan | Membawa risiko ketidakstabilan dan ketidakamanan.
| Alur kerja lebih kompleks. Biasanya, satu orang tidak dapat mengelola seluruh siklus hidup dari pengembangan hingga produksi. |
Studi kasus: Dampak mode standar terhadap alur kerja
Seperti yang ditunjukkan pada diagram berikut, isolasi lingkungan dalam mode standar berdampak pada alur kerja seperti desain model data, logika pemrosesan data, dan penerapan kode.
Pemetaan sumber data untuk modul DataWorks pada masing-masing mode
Anda dapat melihat sumber daya komputasi yang terikat di Data Studio dengan menavigasi ke halaman Computing Resource. Setelah diikat, modul DataWorks beroperasi pada sumber data berikut di masing-masing Mode Ruang Kerja:
Modul DataWorks | Mode standar | Mode dasar |
Data Studio | Beroperasi pada sumber data lingkungan pengembangan (instans, proyek, atau database). | Beroperasi pada sumber data lingkungan produksi (instans, proyek, atau database). |
Operation Center |
|
Mencapai isolasi lingkungan dalam mode dasar
Tujuan: Mengisolasi lingkungan pengembangan dan produksi saat menggunakan ruang kerja Mode Dasar.
Implementasi: Anda dapat menggunakan dua ruang kerja mode dasar yang terpisah, satu sebagai lingkungan pengembangan dan yang lainnya sebagai lingkungan produksi. Anda kemudian dapat menggunakan fitur penerapan lintas ruang kerja untuk menerapkan node dari ruang kerja pengembangan ke ruang kerja produksi. Pendekatan ini mengisolasi lingkungan tersebut.
Kekurangan: Dengan pendekatan ini, Anda masih dapat langsung mengedit kode produksi di modul Data Studio ruang kerja produksi. Artinya, lingkungan produksi tidak memiliki titik masuk tunggal yang terkontrol untuk pembaruan kode, sehingga melewati kontrol alur kerja yang terkelola.
Rekomendasi: Kami sangat menyarankan untuk meningkatkan ruang kerja mode dasar Anda ke ruang kerja mode standar guna menetapkan alur kerja pengembangan yang lebih kuat dan terkelola. Untuk informasi selengkapnya, lihat Peningkatan mode ruang kerja.



