全部产品
Search
文档中心

MaxCompute:Ikhtisar

更新时间:Jul 06, 2025

Untuk menjalankan pekerjaan MaxCompute secara berkala, Anda dapat menggunakan DataStudio di konsol DataWorks untuk mengembangkan pekerjaan yang berjalan pada node otomatis dan mengonfigurasi parameter terkait seperti properti waktu dan dependensi penjadwalan. Setelah itu, Anda dapat menyerahkan pekerjaan MaxCompute ke Pusat Operasi DataWorks untuk penjadwalan berkala. Topik ini menjelaskan cara mengembangkan pekerjaan terjadwal secara berkala di konsol DataWorks.

Alur kerja pengembangan

Gambar berikut menunjukkan alur kerja dasar pengembangan pekerjaan MaxCompute di konsol DataWorks. Development workflow
Catatan Workspace DataWorks dapat bekerja dalam mode dasar atau mode standar. Dalam mode standar, satu workspace DataWorks dikaitkan dengan Proyek MaxCompute di lingkungan produksi dan Proyek MaxCompute di lingkungan pengembangan. Gambar sebelumnya menunjukkan workspace DataWorks dalam mode standar.
Catat poin-poin berikut:
  • Berbagai jenis pekerjaan dapat berjalan pada berbagai jenis node, seperti node ODPS SQL, node ODPS Spark, dan node PyODPS.
  • Di konsol DataWorks, Anda dapat membuat tabel MaxCompute, mendaftarkan fungsi MaxCompute dengan DataWorks, dan membuat sumber daya MaxCompute, sehingga meningkatkan efisiensi pengembangan pekerjaan.
  • Anda juga dapat menggunakan node umum di konsol DataWorks untuk mengimplementasikan logika pekerjaan yang kompleks, seperti loop dan penelusuran.

Penagihan

Jika Anda menggunakan DataWorks DataStudio dan Pusat Operasi untuk membaca atau menulis data ke MaxCompute, memproses data MaxCompute, atau menjadwalkan tugas MaxCompute secara berkala, Anda akan dikenakan biaya tidak hanya untuk sumber daya DataWorks tetapi juga untuk sumber daya layanan Alibaba Cloud lainnya.

1. Biaya untuk sumber daya DataWorks

Bagian ini menjelaskan biaya yang termasuk dalam tagihan DataWorks Anda. Untuk informasi tentang item yang dapat ditagih dari DataWorks, lihat Ikhtisar Penagihan.

Biaya

Deskripsi

Biaya untuk Edisi DataWorks yang Digunakan

Anda harus mengaktifkan DataWorks sebelum dapat mengembangkan tugas di DataWorks. Jika Anda mengaktifkan DataWorks Edisi Standar, Edisi Profesional, atau Edisi Perusahaan, Anda akan dikenakan biaya untuk edisi tersebut saat pembelian.

Biaya untuk Sumber Daya Penjadwalan yang Digunakan untuk Menjadwalkan Tugas

Setelah tugas dikembangkan, sumber daya penjadwalan diperlukan untuk menjadwalkan tugas. Anda dapat membeli grup sumber daya tanpa server atau grup sumber daya eksklusif versi lama untuk penjadwalan, dan membayar untuk grup sumber daya tersebut. Kami merekomendasikan agar Anda membeli grup sumber daya tanpa server.

Catatan

Grup sumber daya tanpa server yang dibeli dapat digunakan untuk penjadwalan tugas dan sinkronisasi data.

Biaya untuk Sumber Daya yang Digunakan untuk Menyinkronkan Data

Tugas sinkronisasi data mengonsumsi sumber daya penjadwalan dan sumber daya sinkronisasi. Anda dapat membeli grup sumber daya tanpa server atau grup sumber daya eksklusif versi lama untuk Integrasi Data, dan membayar untuk grup sumber daya tersebut. Kami merekomendasikan agar Anda membeli grup sumber daya tanpa server.

Catatan
  • Anda tidak dikenakan biaya penjadwalan jika Anda menjalankan tugas pada node dengan mengklik Jalankan atau Jalankan dengan Parameter di bilah alat atas pada halaman DataStudio.

  • Anda tidak dikenakan biaya penjadwalan untuk tugas yang gagal atau tugas uji coba kering.

Untuk informasi lebih lanjut yang membantu Anda memahami detail penagihan, lihat Logika Penerbitan Tugas Penjadwalan di DataWorks.

2. Biaya untuk sumber daya layanan Alibaba Cloud lainnya

Bagian ini menjelaskan biaya yang tidak termasuk dalam tagihan DataWorks Anda. Anda juga mungkin dikenakan biaya untuk sumber daya layanan Alibaba Cloud lainnya yang digunakan untuk mengembangkan dan menjalankan tugas di DataWorks.

Penting

Anda dikenakan biaya untuk sumber daya layanan Alibaba Cloud lainnya berdasarkan logika penagihan layanan Alibaba Cloud. Untuk informasi lebih lanjut, lihat dokumentasi penagihan layanan Alibaba Cloud. Sebagai contoh, untuk informasi tentang detail penagihan mesin komputasi MaxCompute yang Anda gunakan, lihat Item yang Dapat Ditagih dari MaxCompute.

Biaya

Deskripsi

Biaya basis data

Saat Anda menjalankan tugas sinkronisasi data untuk membaca data dari dan menulis data ke basis data, biaya basis data mungkin dihasilkan.

Biaya komputasi dan penyimpanan

Saat Anda menjalankan tugas dari jenis mesin komputasi tertentu, biaya komputasi dan penyimpanan untuk jenis mesin komputasi tersebut mungkin dihasilkan. Sebagai contoh, jika Anda menjalankan tugas pada node ODPS SQL untuk membuat tabel MaxCompute dan menulis data ke tabel MaxCompute, Anda mungkin dikenakan biaya untuk sumber daya komputasi dan penyimpanan mesin komputasi MaxCompute.

Biaya layanan jaringan

Saat Anda membangun koneksi jaringan antara DataWorks dan layanan terkait lainnya, biaya layanan jaringan mungkin dihasilkan. Sebagai contoh, jika Anda menggunakan layanan seperti Express Connect, Elastic IP Address (EIP), dan Bandwidth Internet Bersama, untuk membangun koneksi jaringan antara DataWorks dan layanan terkait lainnya, Anda mungkin dikenakan biaya layanan jaringan.

Manajemen izin

DataWorks menyediakan sistem manajemen izin yang komprehensif bagi Anda untuk mengelola izin tingkat produk dan izin tingkat modul. Di konsol DataWorks, Anda dapat meminta izin pada sumber data MaxCompute atau memproses permintaan untuk mengakses sumber data MaxCompute. Detail manajemen izin:

1. Manajemen izin akses data

Anda dapat menggunakan node ODPS SQL atau kueri ad hoc untuk menanyakan data dalam tabel MaxCompute. Jika Anda menggunakan workspace DataWorks dalam mode dasar, manajemen izin granular dan isolasi data antara lingkungan pengembangan dan produksi tidak didukung. Dalam topik ini, workspace DataWorks dalam mode standar digunakan.

  • Deskripsi Izin Peran Tingkat Workspace Bawaan pada MaxCompute

    Tabel berikut menjelaskan izin pengguna RAM pada MaxCompute setelah pengguna RAM ditambahkan ke workspace sebagai anggota dan diberi peran tingkat workspace.

    Jenis Izin

    Deskripsi

    Izin pada Proyek MaxCompute di Lingkungan Pengembangan

    Setelah Anda memberikan pengguna RAM peran tingkat workspace bawaan di workspace Anda dan mengaitkan Proyek MaxCompute dengan workspace di lingkungan pengembangan, pengguna RAM secara otomatis diberikan izin peran yang dipetakan dari Proyek MaxCompute di lingkungan pengembangan. Namun, pengguna RAM tidak memiliki izin pada Proyek MaxCompute di lingkungan produksi.

    Izin pada Proyek MaxCompute di Lingkungan Produksi

    Pengguna RAM yang digunakan sebagai identitas akses penjadwalan memiliki izin tinggi pada Proyek MaxCompute di lingkungan produksi. Pengguna RAM lainnya tidak memiliki izin pada Proyek MaxCompute di lingkungan produksi. Untuk melakukan operasi pada tabel MaxCompute di lingkungan produksi, Anda harus pergi ke Pusat Keamanan untuk meminta izin yang diperlukan.

    DataWorks menyediakan prosedur pemrosesan permintaan default. DataWorks juga memungkinkan pengguna yang diberi izin manajemen untuk menyesuaikan prosedur pemrosesan permintaan.

    Untuk informasi lebih lanjut tentang manajemen izin untuk MaxCompute, lihat Kelola Izin pada Data di Instance Mesin Komputasi MaxCompute.

  • Deskripsi Perilaku Akses Data

    MaxCompute memungkinkan Anda menanyakan tabel lintas proyek. Anda dapat menanyakan data dalam Proyek MaxCompute yang dikaitkan dengan workspace di lingkungan produksi dengan menentukan nama proyek pada halaman DataStudio. Tabel berikut menjelaskan metode untuk menanyakan tabel lintas proyek dan akun yang dapat digunakan untuk mengakses tabel di lingkungan yang berbeda.

    Catatan
    • Di bagian Informasi Mesin Komputasi halaman Workspace, Anda dapat melihat Proyek MaxCompute yang dikaitkan dengan workspace di lingkungan pengembangan dan produksi serta akun yang digunakan untuk mengonfigurasi lingkungan untuk Proyek MaxCompute. Untuk informasi lebih lanjut tentang cara menambahkan sumber data MaxCompute, lihat Tambahkan Sumber Data MaxCompute.

    • Untuk workspace dalam mode standar, identitas pribadi pelaksana tugas digunakan secara default untuk menjalankan tugas MaxCompute di lingkungan pengembangan, dan akun Alibaba Cloud digunakan sebagai identitas akses penjadwalan untuk menjalankan tugas MaxCompute di lingkungan produksi. Untuk informasi lebih lanjut, lihat Tambahkan Sumber Data MaxCompute.

    Kode Sampel

    Akun Eksekusi di Lingkungan Pengembangan (DataStudio dan Pusat Operasi di Lingkungan Pengembangan)

    Akun Eksekusi di Lingkungan Produksi (Pusat Operasi di Lingkungan Produksi)

    Akses tabel dalam Proyek MaxCompute di lingkungan pengembangan:

    select col1 from projectname_dev.tablename;

    Akun Alibaba Cloud pribadi pelaksana tugas digunakan untuk mengakses tabel dalam Proyek MaxCompute di lingkungan pengembangan.

    • Jika pengguna RAM menjalankan tugas, akun Alibaba Cloud pribadi pengguna RAM digunakan untuk mengakses tabel dalam Proyek MaxCompute di lingkungan pengembangan.

    • Jika akun Alibaba Cloud digunakan untuk menjalankan tugas, akun Alibaba Cloud tersebut digunakan untuk mengakses tabel dalam Proyek MaxCompute di lingkungan pengembangan.

    Identitas akses penjadwalan digunakan untuk mengakses tabel dalam Proyek MaxCompute di lingkungan pengembangan.

    Akses tabel dalam Proyek MaxCompute di lingkungan produksi:

    select col1 from projectname.tablename;

    Akun Alibaba Cloud pribadi pelaksana tugas digunakan untuk mengakses tabel dalam Proyek MaxCompute di lingkungan produksi.

    Catatan

    Karena kontrol keamanan pada data di lingkungan produksi, akun Alibaba Cloud pribadi tidak dapat digunakan untuk mengakses tabel dalam Proyek MaxCompute di lingkungan produksi. Untuk menggunakan akun Alibaba Cloud pribadi untuk mengakses tabel dalam Proyek MaxCompute di lingkungan produksi, pergi ke Pusat Keamanan untuk meminta izin. DataWorks menyediakan prosedur pemrosesan permintaan default. DataWorks juga memungkinkan pengguna yang diberi izin manajemen untuk menyesuaikan prosedur pemrosesan permintaan.

    Identitas akses penjadwalan digunakan untuk mengakses tabel dalam Proyek MaxCompute di lingkungan produksi.

    Jalankan pernyataan berikut dalam Proyek MaxCompute di lingkungan yang diinginkan seperti lingkungan pengembangan untuk mengakses tabel dalam Proyek MaxCompute:

    select col1 from tablename;

    Anda dapat menggunakan akun Alibaba Cloud pribadi pelaksana tugas untuk mengakses tabel dalam Proyek MaxCompute di lingkungan pengembangan.

    Anda dapat menggunakan identitas akses penjadwalan untuk mengakses tabel dalam Proyek MaxCompute di lingkungan produksi.

2. Manajemen izin pada layanan dan fitur

Sebelum Anda mengembangkan data di DataWorks sebagai pengguna RAM, Anda harus memberikan peran tingkat workspace kepada pengguna RAM untuk memberikan izin tertentu kepada pengguna RAM. Untuk informasi lebih lanjut, lihat Praktik Terbaik untuk Mengelola Izin Pengguna RAM.

  • Anda dapat menggunakan Otorisasi Berbasis Kebijakan RAM untuk mengelola izin pada modul layanan DataWorks, seperti melarang pengguna DataWorks mengakses Peta Data, dan untuk mengelola izin melakukan operasi di konsol DataWorks, seperti mengizinkan pengguna DataWorks menghapus workspace.

  • Anda dapat menggunakan kontrol akses berbasis peran (RBAC) untuk mengelola izin pada modul layanan tingkat workspace DataWorks, seperti mengizinkan pengguna DataWorks mengakses DataStudio untuk melakukan operasi terkait pengembangan, dan untuk mengelola izin pada modul layanan tingkat global DataWorks, seperti melarang pengguna DataWorks mengakses Penjaga Keamanan Data.

开发流程