全部产品
Search
文档中心

DataWorks:Ikhtisar

更新时间:Mar 01, 2026

Pusat Admin DataWorks adalah platform visual untuk mengonfigurasi lingkungan dan mengelola resource. Platform ini menyediakan kemampuan manajemen pada dua tingkat: pada tingkat tenant, Anda dapat mengonfigurasi role yang berlaku untuk seluruh tenant dan aturan peringatan; pada tingkat ruang kerja, platform ini memungkinkan konfigurasi detail halus terhadap mesin komputasi khusus, sumber data, dan anggota untuk setiap proyek.

Konsep inti dan arsitektur sistem

Sebelum memulai, penting untuk memahami arsitektur inti dan hubungan entitas dalam DataWorks.

Konsep inti: Ruang Kerja

Ruang Kerja merupakan unit logis dasar dalam DataWorks untuk manajemen proyek, kontrol akses, dan isolasi resource. Semua aktivitas, seperti pengembangan data, operasi tugas, dan manajemen anggota, dilakukan dalam sebuah Ruang Kerja.

  • Isolasi: Ruang Kerja menyediakan isolasi kuat. Setiap ruang kerja bersifat sepenuhnya independen dalam hal tugas, resource, dan anggota.

  • Container: Ruang Kerja berfungsi sebagai container yang menampung modul fungsional seperti Pengembangan Data dan Integrasi Data, serta terhubung ke entitas eksternal termasuk sumber data, mesin komputasi, dan kelompok sumber daya.

Arsitektur dan hubungan entitas

Diagram berikut menunjukkan dependensi dan hubungan antar entitas inti dalam DataWorks.

image
  1. Ruang Kerja: Terletak di pusat arsitektur, Ruang Kerja merupakan unit dasar untuk semua operasi. Fungsi seperti Pengembangan Data, Integrasi Data, dan O&M Center berjalan dalam Ruang Kerja tertentu.

  2. Kelompok Sumber Daya:

    Catatan

    Kelompok Sumber Daya dalam DataWorks menyediakan resource komputasi untuk menjalankan tugas dan dibeli secara terpisah. Ini merupakan konsep yang berbeda dari resource group dalam Alibaba Cloud Resource Management, yang digunakan untuk isolasi resource dan manajemen izin di seluruh Akun Alibaba Cloud Anda.

    • Definisi: Entitas yang menyediakan resource komputasi (CPU dan memori) untuk eksekusi tugas. Entitas ini eksis secara independen dari Ruang Kerja.

    • Hubungan: Binding wajib dilakukan. Seperti ditunjukkan di sisi kanan diagram, Anda harus mengikat Kelompok Sumber Daya ke satu atau beberapa Ruang Kerja agar tugas Integrasi Data dan tugas Pengembangan Data yang dijadwalkan dapat memperoleh resource komputasi yang diperlukan saat runtime.

  3. Compute Engine:

    • Definisi: Entitas yang menyediakan lingkungan parsing sintaks, kompilasi, dan eksekusi untuk modul Pengembangan Data. Contohnya termasuk MaxCompute, Hologres, dan EMR.

    • Hubungan: Dependensi pengembangan. Seperti ditunjukkan oleh panah input ke modul Pengembangan Data, Anda harus mengikat mesin komputasi ke Ruang Kerja. Hal ini memungkinkan developer menulis, men-debug, dan mengirimkan kode (seperti SQL atau Spark) dalam modul Pengembangan Data.

  4. Sumber Data:

    • Definisi: Konfigurasi informasi koneksi yang digunakan untuk mengakses penyimpanan data eksternal, seperti MySQL, Oracle, atau OSS.

    • Hubungan: Dependensi integrasi. Seperti ditunjukkan oleh panah input ke modul Integrasi Data, sumber dan sink dari tugas integrasi data bergantung pada sumber data yang telah dikonfigurasi sebelumnya dalam Ruang Kerja.

  5. Gambar Kustom:

    • Definisi: Lingkungan terpaket yang berisi sistem operasi tertentu, lingkungan runtime, dan library pihak ketiga.

    • Hubungan: Ikat sesuai kebutuhan. Seperti ditunjukkan di sisi kiri, ketika lingkungan pengembangan Anda (Data Studio) atau jenis node Pengembangan Data tertentu (seperti PyODPS) memerlukan dependensi yang tidak tersedia dalam lingkungan standar, Anda dapat mengikat gambar kustom. Ini merupakan fitur lanjutan.

  6. Layanan global lintas ruang kerja:

    • Seperti ditunjukkan di bagian atas diagram, modul seperti Tata Kelola Data dan Peta Data beroperasi di atas tingkat Ruang Kerja. Modul-modul ini menyediakan tampilan data global dan kemampuan manajemen pada tingkat tenant. Sistem izinnya bersifat independen dari masing-masing Ruang Kerja.

Sebelum memulai

  • Izin: Jika Anda tidak dapat melihat atau melakukan operasi tertentu, hubungi pemilik Akun Alibaba Cloud Anda atau administrator untuk memastikan Anda memiliki izin yang diperlukan. Untuk informasi lebih lanjut, lihat Manajemen izin anggota.

  • Isolasi wilayah: Ruang Kerja DataWorks dan resource terkaitnya diisolasi berdasarkan Region. Sebelum melakukan operasi apa pun, pilih Region yang benar di bilah navigasi atas konsol.

Memulai

Jika Anda mengonfigurasi DataWorks untuk pertama kalinya, ikuti alur kerja standar ini untuk memastikan lingkungan Anda lengkap dan siap digunakan.

Penting

Pastikan Anda menggunakan Akun Alibaba Cloud atau pengguna Resource Access Management (RAM) dengan kebijakan AliyunDataWorksFullAccess. Jika tidak, hubungi administrator untuk memberikan izin kepada pengguna RAM.

1. Buat Ruang Kerja

Login ke konsol DataWorks. Di bilah navigasi atas, pilih Region target. Di panel navigasi kiri, klik Workspace, lalu klik Create Workspace. Pilih mode ruang kerja sesuai kebutuhan Anda. Kami merekomendasikan menggunakan Standard Mode untuk isolasi penuh antara lingkungan pengembangan, pengujian, dan produksi.

Untuk informasi lebih lanjut, lihat Buat ruang kerja.

image

2. Konfigurasi dan ikat Kelompok Sumber Daya

  1. Buat atau beli Kelompok Sumber Daya: Di panel navigasi kiri konsol, buka daftar Resource Group. Beli Kelompok Sumber Daya yang sesuai berdasarkan beban kerja tugas Anda, seperti Serverless resource group.

  2. Ikat Kelompok Sumber Daya ke Ruang Kerja Anda: Langkah ini merupakan prasyarat agar fitur inti seperti Integrasi Data, penjadwalan tugas, dan DataService Studio dapat berfungsi.

    image

3. Tambahkan anggota ke Ruang Kerja

  1. Di daftar ruang kerja, klik Details di kolom Actions ruang kerja target untuk membuka halaman detailnya.

  2. Tambahkan anggota tim proyek Anda (pengguna RAM) dan tetapkan role tingkat ruang kerja yang sesuai, seperti Workspace Administrator, Developer, atau O&M. Hal ini memungkinkan pengembangan kolaboratif dan kontrol akses.

    Untuk informasi lebih lanjut, lihat Tambahkan anggota ke ruang kerja.

    image

4. Tautkan Compute Engine

Di halaman detail ruang kerja, navigasikan ke daftar Computing Resource dan ikat instans mesin komputasi yang sudah ada, seperti proyek MaxCompute, ke Ruang Kerja saat ini. Langkah ini merupakan prasyarat untuk pengembangan data.

image

5. Tambahkan Sumber Data

Di halaman detail ruang kerja, navigasikan ke Data Sources dan klik Add Data Source. Konfigurasikan informasi koneksi untuk database sumber atau sink yang Anda perlukan untuk sinkronisasi data, lalu uji konektivitasnya.

image

Setelah menyelesaikan lima langkah ini, Ruang Kerja DataWorks Anda siap untuk pengembangan dan eksekusi. Anda kini dapat memulai tugas Integrasi Data dan Pengembangan Data.

Ikhtisar fitur administratif

Ikhtisar dan navigasi

Panel navigasi kiri konsol merupakan titik masuk untuk semua fitur administratif, termasuk daftar ruang kerja, daftar kelompok sumber daya, Manajemen Gambar, serta Resource dan Layanan yang Telah Dibeli. Saat Anda login ke konsol DataWorks, halaman ikhtisar ditampilkan secara default. Halaman ini menyediakan akses cepat ke kasus penggunaan inti, Ruang Kerja yang sering digunakan, pembaruan produk, dan informasi lainnya.

Konfigurasi global

Konfigurasi berikut berada pada tingkat tenant dan berlaku untuk semua Ruang Kerja di Region saat ini.

  1. Buka Admin Center dengan mengklik More > Admin Center di panel navigasi, atau dengan mengklik tombol Manage di kolom Actions ruang kerja.

    image

  2. Lihat Alert Configuration, Tenant Members and Roles, dan Extensions milik tenant.

    image

    Modul fitur

    Deskripsi dan tindakan inti

    Alert Configuration

    Lihat dan konfigurasikan informasi kontak peringatan DataWorks serta tetapkan kuota peringatan.

    Alert Resources: Lihat penggunaan resource peringatan (pesan SMS dan panggilan telepon) dan tetapkan batas harian peringatan. Setelah batas tercapai, tidak ada lagi peringatan yang dikirim.
    Alert Contacts: Konfigurasikan kontak untuk menerima peringatan tugas. Anda dapat menyinkronkan kontak dari RAM atau menambahkannya secara manual. Kontak harus diaktifkan agar dapat menerima peringatan.

    Untuk informasi lebih lanjut, lihat Lihat dan atur kontak peringatan.

    Tenant Members and Roles

    Tenant Members: Konfigurasikan anggota yang memiliki izin pada modul global, seperti Penjaga Keamanan Data dan Peta Data.
    Tenant Roles: Lihat atau sesuaikan role global beserta izinnya.

    Untuk informasi lebih lanjut, lihat Kontrol izin modul global.

    Extensions

    Aktifkan atau konfigurasikan aplikasi ekstensi dari platform terbuka untuk menerapkan validasi dan kontrol pada alur kerja pengembangan dan O&M.

    Untuk informasi lebih lanjut, lihat Ekstensi.

Konfigurasi spesifik Ruang Kerja

Konfigurasi berikut hanya berlaku untuk Ruang Kerja saat ini.

Modul fitur

Deskripsi dan tindakan inti

Workspace Settings

Kelola properti dasar ruang kerja dan pengaturan keamanan, seperti apakah hasil pernyataan SELECT boleh diunduh.

Untuk informasi lebih lanjut, lihat Konfigurasi ruang kerja.

Data Source

Kelola secara terpusat informasi koneksi untuk sumber dan sink yang digunakan dalam sinkronisasi data di Ruang Kerja saat ini.

Untuk informasi lebih lanjut, lihat Manajemen sumber data.

Computing Resource

Ikat dan kelola mesin komputasi yang digunakan untuk pengembangan data di Ruang Kerja, seperti MaxCompute, Hologres, dan AnalyticDB.

Untuk informasi lebih lanjut, lihat Manajemen resource komputasi.

Cluster Management

Daftarkan dan kelola kluster CDH/CDP dan EMR yang dikelola sendiri. Konfigurasikan file autentikasi dan pemetaan akun. Ini hanya terlihat untuk Ruang Kerja yang tidak menggunakan Data Studio versi baru.

Workspace Members and Roles

Lihat izin role yang telah ditentukan. Anda dapat membuat role baru dengan mengonfigurasi izin fungsional dan pemetaan role untuk mesin komputasi. Anda juga dapat menambah atau menghapus anggota ruang kerja serta menetapkan role yang telah ditentukan atau kustom kepada mereka.

Untuk informasi lebih lanjut, lihat Kontrol izin modul tingkat ruang kerja.

Manajemen Ruang Kerja

Di panel navigasi kiri konsol, klik Workspaces untuk melihat semua Ruang Kerja di bawah tenant saat ini dalam Region tertentu. Anda dapat mengelola Ruang Kerja yang telah Anda ikuti atau membuat yang baru.

Catatan

Pengguna RAM hanya dapat melihat Ruang Kerja yang telah mereka ikuti. Untuk memungkinkan pengguna RAM melihat Ruang Kerja, tambahkan pengguna tersebut sebagai anggota ruang kerja. Untuk informasi lebih lanjut, lihat Tambahkan anggota ke ruang kerja.

控制台

Area

Fitur

Deskripsi

Dokumentasi terkait

1

Select Region

Alihkan Region untuk DataWorks. Daftar Ruang Kerja berubah berdasarkan Region yang dipilih.

-

2

Create Workspace

Buat Ruang Kerja DataWorks baru.

Konfigurasi ruang kerja.

3

View basic workspace information

Lihat informasi dasar tentang Ruang Kerja, seperti mode dan administrator. Informasi utama meliputi:

  • Templat Ruang Kerja: Mendukung semua fitur dan ruang kerja OpenLake.

  • Mode: Mode saat ini dari Ruang Kerja. DataWorks mendukung Simple Mode dan Standard Mode. Kami merekomendasikan menggunakan Standard Mode untuk pengembangan produksi.

  • Administrator: Administrator Ruang Kerja. Di halaman Admin Center > Workspaces > Workspace Members, administrator dapat menambahkan pengguna RAM ke Ruang Kerja.

  • Resource Group ID: Kelompok sumber daya tempat Ruang Kerja Anda saat ini ditugaskan. Ini adalah default resource group yang Anda buat di Alibaba Cloud Resource Management.

    Penting

    Kelompok sumber daya yang ditampilkan di sini adalah mekanisme untuk mengelola dan mengelompokkan resource di bawah Akun Alibaba Cloud Anda guna menyederhanakan organisasi dan otorisasi resource. Ini merupakan konsep yang berbeda dari kelompok sumber daya yang diperlukan untuk menjalankan tugas di DataWorks. Untuk informasi lebih lanjut tentang kelompok sumber daya Alibaba Cloud, lihat Apa itu Resource Management?.

4

Workspace operations

Lihat metrik utama untuk Ruang Kerja saat ini, akses cepat ke modul tertentu, atau lakukan operasi terkait ruang kerja.

  • Details: Lihat data tentang eksekusi instans, isu tata kelola, model, dan metrik dari tanggal bisnis sebelumnya.

  • Quick Access: Navigasi cepat ke modul fungsional yang terkait dengan Ruang Kerja saat ini.

  • Manage: Navigasi cepat ke Pusat Admin untuk mengonfigurasi ruang kerja dan mengelola anggota, role, sumber data, kluster, dan ekstensi.

  • Create Data Source: Buat sumber data dengan cepat untuk tugas selanjutnya seperti integrasi data dan pengembangan data.

  • Bind Compute Engine: Ikat mesin komputasi ke Ruang Kerja untuk tugas pengembangan data besar selanjutnya.

  • Delete Workspace: Hapus ruang kerja. Ruang kerja yang dihapus tidak dapat dipulihkan.

  • Disable Workspace: Jika Anda tidak lagi memerlukan DataWorks, Anda dapat menonaktifkan ruang kerja. Setelah dinonaktifkan, tugas di ruang kerja tidak lagi dijadwalkan secara otomatis. Namun, resource engine terkait mungkin tetap aktif dan terus dikenai biaya.

5

Edition Upgrade

Tingkatkan edisi DataWorks Anda saat ini.

  • Edisi yang lebih tinggi menyediakan lebih banyak fitur. Fitur yang tersedia bervariasi berdasarkan edisi.

  • Edisi diaktifkan pada tingkat Region. Setelah Anda membeli edisi, semua Ruang Kerja di Region saat ini dapat menggunakan fiturnya.

Untuk informasi lebih lanjut tentang perbedaan antar edisi, lihat Detail fitur berdasarkan edisi DataWorks.

Purchase exclusive resource group

Anda dapat membeli Serverless resource group. Setelah pembelian, Anda dapat mengklik Resource Groups di panel navigasi kiri untuk melihat detailnya.

Manajemen kelompok sumber daya

Kelompok Sumber Daya

Di panel navigasi kiri, klik Resource Groups. Anda dapat membeli resource yang diperlukan atau melihat detail resource yang telah dibeli di Region yang sesuai dan melakukan operasi manajemen.

image

Area

Fitur

Deskripsi

Dokumentasi terkait

1

Create resource group

Buat Serverless resource group baru.

Manajemen kelompok sumber daya

2

View basic resource group information

Lihat informasi dasar tentang kelompok sumber daya, seperti status berjalan, waktu kedaluwarsa, dan penggunaan.

  • Area 2, kelompok sumber daya Status

    • Starting: Kelompok sumber daya sedang memulai setelah pembelian. Harap tunggu.

    • Running: Kelompok sumber daya berjalan normal dan dapat mengeksekusi tugas.

    • Updating: Kelompok sumber daya sedang mengalami perubahan, seperti scaling.

      Catatan

      Proses pembaruan memerlukan waktu. Harap tunggu.

    • Expired: Jika kelompok sumber daya Subscription tidak diperpanjang setelah kedaluwarsa, statusnya berubah menjadi Expired dan tidak dapat digunakan lagi. Jika tidak diperpanjang dalam periode tenggang, kelompok sumber daya akan dihapus dari konsol.

    • Frozen: Kelompok sumber daya Pay-as-you-go secara otomatis dibekukan jika tidak digunakan selama tujuh hari berturut-turut.

  • Area 3, penggunaan kelompok sumber daya: Jika penggunaan kelompok sumber daya terlalu tinggi, performa tugas mungkin menurun. Periksa konsumsi resource tugas tertentu dan optimalkan tugas yang menggunakan resource secara tidak efisien.

3

4

Basic resource group operations

Lihat informasi detail tentang kelompok sumber daya dan lakukan operasi perubahan terkait.

  • Details: Lihat informasi dasar, penggunaan resource, penggunaan konkurensi penjadwalan, dan penggunaannya di berbagai modul seperti Integrasi Data, Analitik Data, Layanan Data, Penjadwalan Data, dan lingkungan pengembangan individual.

  • Network Settings: Jika Anda perlu mengakses lingkungan jaringan khusus, Anda harus mengonfigurasi jaringan untuk kelompok sumber daya. Sebelum konfigurasi, pilih solusi konektivitas jaringan dan rujuk dokumentasinya untuk petunjuk.

  • Associate with Workspace: Setelah membeli kelompok sumber daya, Anda harus mengikatnya ke Ruang Kerja tertentu sebelum dapat digunakan.

    Anda harus memiliki izin ModifyResourceGroup untuk mengubah ruang kerja terkait. Untuk informasi tentang pemberian izin, lihat Kontrol akses konsol detail halus: Kebijakan kustom.

  • More operations: Anda dapat mengklik image untuk melakukan operasi seperti Scale Out, Scale In, Renew, Unsubscribe, Quota Management, Change Billing Method, dan Change Concurrency Limit for Data Scheduling pada kelompok sumber daya.

Catatan

Perubahan pada kelompok sumber daya memerlukan waktu untuk diproses. Harap tunggu.

Layanan LLM

Di panel navigasi kiri, klik LLM Management untuk menuju halaman layanan LLM. Layanan LLM menyediakan solusi satu atap untuk penerapan efisien, komunikasi aman, dan pemanggilan model yang mudah. Anda dapat dengan mudah menerapkan model menggunakan kelompok sumber daya DataWorks Serverless dan langsung memanggil LLM dalam tugas integrasi data dan pengembangan data. Untuk informasi lebih lanjut, lihat Kelola layanan model besar.

Manajemen Gambar

Di panel navigasi kiri, klik Image Management untuk melihat gambar resmi DataWorks. Jika tugas memerlukan lingkungan pengembangan tertentu (seperti library pihak ketiga), buat gambar kustom dengan dependensi yang diperlukan. Anda kemudian dapat memilih gambar ini sebagai lingkungan runtime saat menjalankan tugas pada kelompok sumber daya Serverless. Untuk informasi lebih lanjut, lihat Gambar kustom.

Resource dan Layanan yang Telah Dibeli

Di panel navigasi kiri, klik Purchased Resources and Services untuk melihat detail layanan DataWorks dan kelompok sumber daya Subscription serta Pay-as-you-go yang telah Anda beli. Anda dapat melihat Tagihan dan Aturan Penagihan yang sesuai, atau melakukan operasi seperti Renew, Upgrade, Downgrade, dan Unsubscribe. Untuk dokumentasi terkait, lihat Melihat tagihan dan Ikhtisar.