DataWorks memungkinkan Anda membangun gudang data real-time dan sistem analisis ad hoc berdasarkan Hologres. Di konsol DataWorks, Anda dapat mengonfigurasi tugas Hologres, mengaktifkan penjadwalan periodik, serta mengelola metadata untuk memastikan data dihasilkan dan dikelola secara efisien dan stabil. Topik ini menjelaskan proses dasar pengembangan tugas Hologres di DataWorks, termasuk penagihan, persiapan lingkungan, dan manajemen izin.
Prasyarat
DataWorks telah diaktifkan. Untuk informasi lebih lanjut, lihat Aktifkan DataWorks.
DataWorks telah diaktifkan. Untuk informasi lebih lanjut, lihat Aktifkan DataWorks.
Ruang kerja DataWorks telah dibuat. Untuk informasi lebih lanjut, lihat Buat dan Kelola Ruang Kerja.
Catatan penggunaan
Tabel berikut menjelaskan catatan penggunaan untuk pengembangan tugas Hologres di DataWorks.
Item | Deskripsi |
Jika Anda mengembangkan tugas Hologres di DataWorks, Anda akan dikenakan biaya tidak hanya untuk sumber daya DataWorks tetapi juga sumber daya layanan Alibaba Cloud lainnya. | |
Sebelum Anda mengembangkan tugas Hologres di DataWorks, Anda harus membeli DataWorks edisi tertentu dan grup sumber daya berdasarkan kebutuhan bisnis Anda, menambahkan sumber data Hologres, dan kemudian mengaitkan sumber data dengan ruang kerja. | |
DataWorks menyediakan sistem manajemen izin yang komprehensif yang dapat Anda gunakan untuk mengelola izin tingkat produk dan izin tingkat modul. Anda dapat memberikan izin berbeda kepada pengguna berbeda berdasarkan kebutuhan bisnis Anda untuk menerapkan manajemen izin yang terperinci. | |
DataWorks Data Integration memungkinkan Anda membaca data dari dan menulis data ke Hologres. DataWorks menyediakan berbagai skenario sinkronisasi data, seperti sinkronisasi batch, sinkronisasi real-time, dan sinkronisasi penuh serta inkremental. | |
DataWorks menyediakan layanan Pemodelan Data yang digunakan untuk menyusun dan mengelola volume besar data yang tidak terstruktur dan kompleks. DataWorks juga menyediakan layanan DataStudio untuk pengembangan tugas yang dijadwalkan untuk dijalankan. Setelah tugas dikembangkan, Anda dapat pergi ke Operation Center untuk memantau dan melakukan operasi O&M pada tugas-tugas tersebut. | |
DataWorks memungkinkan Anda mengelola metadata Hologres dan mengatur data Hologres. | |
DataWorks DataAnalysis menyediakan kemampuan analisis data Hologres dan berbagi layanan. | |
DataWorks menyediakan kemampuan keterbukaan yang memungkinkan sistem aplikasi Anda dengan cepat berintegrasi dengan DataWorks. Anda dapat menggunakan DataWorks untuk mengelola proses terkait data, mengatur data, melakukan operasi O&M pada data, dan merespons dengan cepat terhadap perubahan status bisnis dalam sistem aplikasi. |
Penagihan
DataWorks memungkinkan Anda membuat tugas sinkronisasi Hologres dan tugas pemrosesan data di DataStudio, serta mendukung penjadwalan periodik tugas-tugas tersebut di Operation Center. Anda akan dikenakan biaya tidak hanya untuk sumber daya DataWorks tetapi juga untuk layanan Alibaba Cloud lainnya. Rincian biaya disediakan dalam tabel berikut.
1. Biaya untuk sumber daya DataWorks
Bagian ini menjelaskan biaya yang termasuk dalam tagihan DataWorks Anda. Untuk informasi lebih lanjut tentang item yang dapat ditagih dari DataWorks, lihat Ikhtisar Penagihan.
Biaya | Deskripsi |
Biaya untuk Edisi DataWorks yang Digunakan | Anda harus mengaktifkan DataWorks sebelum mengembangkan tugas di platform ini. Jika Anda menggunakan DataWorks Edisi Standar, Edisi Profesional, atau Edisi Perusahaan, Anda akan dikenakan biaya sesuai dengan edisi yang dipilih saat pembelian. |
Biaya untuk Sumber Daya Penjadwalan | Setelah tugas dikembangkan, sumber daya penjadwalan diperlukan untuk menjalankan tugas secara berkala. Anda dapat membeli grup sumber daya serverless atau grup sumber daya eksklusif versi lama untuk penjadwalan, dan membayar sesuai dengan kebutuhan. Kami merekomendasikan penggunaan grup sumber daya serverless. Catatan Grup sumber daya serverless yang dibeli dapat digunakan untuk penjadwalan tugas dan sinkronisasi data. |
Biaya untuk Sumber Daya Sinkronisasi Data | Tugas sinkronisasi data memerlukan sumber daya penjadwalan dan sumber daya sinkronisasi. Anda dapat membeli grup sumber daya serverless atau grup sumber daya eksklusif versi lama untuk Data Integration, dan membayar sesuai dengan kebutuhan. Kami merekomendasikan penggunaan grup sumber daya serverless. |
Anda tidak dikenakan biaya penjadwalan jika menjalankan tugas pada node dengan mengklik Jalankan atau Jalankan dengan Parameter di bilah alat atas pada halaman DataStudio.
Anda tidak dikenakan biaya penjadwalan untuk tugas yang gagal atau tugas uji coba kering.
Untuk informasi lebih lanjut tentang logika penagihan, lihat Logika Penerbitan Tugas Penjadwalan di DataWorks.
2. Biaya untuk sumber daya layanan Alibaba Cloud lainnya
Bagian ini menjelaskan biaya yang tidak termasuk dalam tagihan DataWorks Anda. Anda juga dapat dikenakan biaya untuk layanan Alibaba Cloud lainnya yang digunakan dalam pengembangan dan pelaksanaan tugas di DataWorks.
Biaya untuk layanan Alibaba Cloud lainnya dihitung berdasarkan logika penagihan masing-masing layanan. Untuk informasi lebih lanjut, lihat dokumentasi penagihan layanan Alibaba Cloud. Misalnya, jika Anda menggunakan mesin komputasi Hologres, Anda akan dikenakan biaya berdasarkan logika penagihan Hologres. Untuk detail lebih lanjut, lihat Item yang Dapat Ditagih dari Hologres.
Biaya | Deskripsi |
Biaya database | Saat Anda menjalankan tugas sinkronisasi data untuk membaca data dari dan menulis data ke database, biaya database mungkin dihasilkan. |
Biaya komputasi dan penyimpanan | Saat Anda menjalankan tugas jenis mesin komputasi tertentu, biaya komputasi dan penyimpanan jenis mesin komputasi ini mungkin dihasilkan. Misalnya, jika Anda membuat dan menjalankan tugas SQL Hologres untuk menanyakan data Hologres, Anda mungkin dikenakan biaya untuk sumber daya komputasi dan penyimpanan mesin komputasi Hologres. |
Biaya layanan jaringan | Saat Anda membangun koneksi jaringan antara DataWorks dan layanan terkait lainnya, biaya layanan jaringan mungkin dihasilkan. Misalnya, jika Anda menggunakan layanan seperti Express Connect, Elastic IP Address (EIP), dan Internet Shared Bandwidth untuk membangun koneksi jaringan antara DataWorks dan layanan terkait lainnya, Anda mungkin dikenakan biaya layanan jaringan. |
Persiapan lingkungan
Sebelum mengembangkan tugas Hologres di DataWorks, Anda harus membeli edisi DataWorks tertentu dan grup sumber daya sesuai kebutuhan bisnis, mengaitkan mesin komputasi Hologres dengan ruang kerja DataWorks, serta menyiapkan lingkungan pengembangan. Rincian disediakan dalam tabel berikut.
1. Persiapan sumber daya
DataWorks menyediakan Edisi Standar, Edisi Profesional, dan Edisi Perusahaan yang mendukung berbagai fitur. DataWorks juga menyediakan grup sumber daya serverless yang didedikasikan untuk penyewa. Anda dapat memilih edisi DataWorks dan grup sumber daya berdasarkan kebutuhan bisnis Anda.
Item | Deskripsi | Referensi |
Pilih edisi DataWorks | DataWorks Edisi Dasar memungkinkan Anda melakukan operasi dasar berikut selama pengembangan data Hologres: migrasi data ke cloud, pengembangan data, penjadwalan tugas Hologres, dan tata kelola data. Jika Anda ingin menggunakan solusi tata kelola data dan keamanan data yang lebih canggih, Anda dapat membeli DataWorks Edisi Standar, DataWorks Edisi Profesional, atau DataWorks Edisi Perusahaan. | |
Pilih grup sumber daya |
|
2. Persiapan lingkungan pengembangan
Anda harus menambahkan instance Hologres ke ruang kerja DataWorks sebagai sumber data dan mengaitkan sumber data dengan DataStudio sebelum mengembangkan data. Anda juga dapat menambahkan pengguna ke ruang kerja sebagai anggota untuk memfasilitasi pengembangan data kolaboratif.
Item | Deskripsi | Referensi |
Siapkan lingkungan sinkronisasi data | Sebelum Anda menjalankan tugas sinkronisasi Hologres di DataWorks untuk mensinkronkan data dari atau ke Hologres, Anda harus menambahkan instance Hologres ke ruang kerja DataWorks sebagai sumber data. Anda dapat mengonfigurasi tugas sinkronisasi untuk sumber data hanya setelah sumber data ditambahkan. | |
Siapkan lingkungan untuk pengembangan dan analisis data | Sebelum Anda menggunakan DataWorks untuk menjadwalkan tugas Hologres, Anda harus menambahkan instance Hologres ke ruang kerja DataWorks sebagai sumber data dan mengaitkan sumber data dengan DataStudio. Kemudian, Anda dapat melakukan operasi seperti pengembangan data, analisis data, dan penjadwalan tugas periodik berdasarkan sumber data. | |
Siapkan lingkungan pengembangan kolaboratif | Untuk memastikan bahwa pengguna RAM dapat berkolaborasi satu sama lain untuk mengembangkan data dalam ruang kerja, Anda harus melakukan operasi berikut:
|
Manajemen izin
DataWorks menyediakan sistem manajemen izin komprehensif yang dapat digunakan untuk mengelola izin tingkat produk dan modul. Anda dapat memberikan izin berbeda kepada pengguna berdasarkan kebutuhan bisnis. Detail manajemen izin adalah sebagai berikut:
1. Manajemen izin akses data
Jika Anda ingin menggunakan pengguna RAM yang ditambahkan ke ruang kerja DataWorks untuk mengembangkan tugas Hologres di DataWorks, Anda harus memberikan izin kepada pengguna RAM pada instance mesin komputasi Hologres, sumber data Hologres yang terkait dengan ruang kerja, dan tabel terkait. Untuk informasi lebih lanjut, lihat Manajemen Izin untuk Hologres.
2. Manajemen izin pada layanan dan fitur
Sebelum mengembangkan data di DataWorks sebagai pengguna RAM, Anda harus menetapkan peran tingkat ruang kerja kepada pengguna RAM untuk memberikan izin tertentu. Untuk informasi lebih lanjut, lihat Praktik Terbaik untuk Mengelola Izin Pengguna RAM. Periksa sistem manajemen izin berikut:
Anda dapat menggunakan Otorisasi Berbasis Kebijakan RAM untuk mengelola izin pada modul layanan DataWorks, seperti melarang pengguna DataWorks mengakses Data Map, dan untuk mengelola izin melakukan operasi di konsol DataWorks, seperti mengizinkan pengguna DataWorks menghapus ruang kerja.
Anda dapat menggunakan Kontrol Akses Berbasis Peran (RBAC) untuk mengelola izin pada modul layanan tingkat ruang kerja DataWorks, seperti mengizinkan pengguna DataWorks mengakses DataStudio untuk melakukan operasi terkait pengembangan, dan untuk mengelola izin pada modul layanan tingkat global DataWorks, seperti melarang pengguna DataWorks mengakses Data Security Guard.

Memulai
DataWorks menyediakan beberapa modul yang memungkinkan Anda mengembangkan tugas dengan properti penjadwalan yang dikonfigurasi di DataStudio. Setelah tugas dikembangkan, Anda dapat memantau dan melakukan operasi O&M pada tugas tersebut di Operation Center di lingkungan produksi. DataWorks juga menyediakan kontrol proses untuk pengembangan dan penerapan tugas guna menstandardisasi operasi pengembangan data dan memastikan keamanan pengembangan data.
1. Integrasi data
DataWorks Data Integration memungkinkan Anda membaca dan menulis data ke Hologres. Anda dapat menyinkronkan data antara sumber data Hologres dan jenis sumber data lainnya. Selain itu, DataWorks menyediakan berbagai skenario sinkronisasi data, seperti sinkronisasi batch, sinkronisasi real-time, serta sinkronisasi penuh dan bertahap. Anda dapat memilih salah satu berdasarkan kebutuhan bisnis Anda. Untuk informasi lebih lanjut, lihat Ikhtisar Integrasi Data.
2. Pemodelan data dan pengembangan
Modul | Deskripsi | Referensi |
Pemodelan Data | Pemodelan Data adalah langkah pertama untuk tata kelola data ujung ke ujung. Pemodelan Data menggunakan metodologi pemodelan dari Alibaba data mid-end, menginterpretasikan data bisnis perusahaan dari perspektif bisnis dengan menggunakan perencanaan gudang data, standar data, pemodelan dimensional, dan modul data metrik, serta memungkinkan personel di dalam perusahaan untuk dengan cepat memahami dan berbagi gagasan tentang pengukuran dan interpretasi data bisnis sesuai dengan spesifikasi gudang data. | |
DataStudio | DataWorks mengemas kemampuan mesin komputasi Hologres dan memungkinkan Anda menjalankan tugas sinkronisasi data Hologres dan tugas pengembangan data Hologres.
|
|
Anda dapat menggunakan node umum dan node jenis mesin komputasi tertentu di DataWorks untuk memproses logika yang kompleks. DataWorks mendukung jenis-jenis node umum berikut:
| ||
Setelah tugas pada node dikembangkan, Anda dapat melakukan operasi berikut berdasarkan kebutuhan bisnis Anda:
| ||
Operation Center | Operation Center adalah platform O&M dan pemantauan big data ujung ke ujung. Operation Center memungkinkan Anda melihat status tugas dan melakukan operasi O&M pada tugas yang mengalami pengecualian. Misalnya, Anda dapat melakukan diagnosis cerdas dan menjalankan ulang tugas di Operation Center. Operation Center menyediakan fitur baseline cerdas yang dapat Anda gunakan untuk menyelesaikan masalah seperti waktu output yang tidak terkendali dari tugas penting dan kesulitan dalam pemantauan tugas dalam jumlah besar. Fitur ini membantu Anda memastikan ketepatan waktu output tugas. | |
Kualitas Data | Kualitas Data memastikan ketersediaan data untuk proses R&D data ujung ke ujung dan menyediakan data yang andal untuk bisnis Anda secara efisien. Kualitas Data dapat membantu Anda mengidentifikasi masalah kualitas data pada kesempatan pertama dan mencegah masalah kualitas data meningkat melalui pemeriksaan kualitas berbasis aturan pemantauan yang efektif dan kombinasi aturan pemantauan dengan proses penjadwalan tugas. |
3. Tata kelola data
Setelah Anda mengaitkan sumber data Hologres dengan ruang kerja DataWorks, DataWorks secara otomatis mengumpulkan metadata dari sumber data tersebut. Anda dapat pergi ke Peta Data untuk melihat metadata dari sumber data. Anda juga dapat pergi ke Pusat Tata Kelola Data untuk melihat masalah tata kelola data yang terdeteksi oleh DataWorks.
Modul | Deskripsi | Referensi |
Peta Data | Peta Data adalah platform manajemen data tingkat perusahaan yang menyediakan kemampuan manajemen, pengurutan, pencarian cepat, dan pemahaman mendalam tentang objek data berdasarkan layanan metadata terpadu di tingkat bawah. | |
Pusat Keamanan Penjaga Keamanan Data Pusat Persetujuan | Pusat Keamanan adalah platform tata kelola keamanan data ujung-ke-ujung yang mencakup klasifikasi aset data, identifikasi data sensitif, manajemen otorisasi terkait data, masking data sensitif, audit akses ke data sensitif, serta identifikasi dan penanganan risiko. Pusat Keamanan membantu Anda menentukan masalah tata kelola keamanan data. | |
Pusat Tata Kelola Data | Pusat Tata Kelola Data secara otomatis mengidentifikasi item yang perlu dikelola untuk beberapa bidang tata kelola berdasarkan aturan yang berasal dari pengalaman di bidang-bidang terkait data, dan menyediakan solusi tata kelola serta optimasi yang mencakup pencegahan masalah sebelum kejadian dan resolusi masalah setelah kejadian. Pusat Tata Kelola Data dapat membantu Anda menyelesaikan tata kelola data secara aktif dan sistematis. |
4. Analisis data dan layanan
DataAnalysis dan DataService Studio dirancang untuk menyediakan kemampuan pemrosesan dan analisis data bagi perusahaan serta membantu perusahaan menggunakan API yang dikelola secara terpusat untuk mengakses dan berbagi data.
Modul | Deskripsi | Referensi |
DataAnalysis | Modul DataAnalysis dari DataWorks membantu Anda melakukan analisis berbasis SQL secara online, memahami kebutuhan bisnis, serta mengedit dan berbagi data, dan memungkinkan Anda menyimpan hasil kueri sebagai kartu grafik dan dengan cepat menghasilkan laporan data visual berdasarkan kartu grafik untuk pelaporan harian. | Untuk informasi lebih lanjut, lihat Ikhtisar DataAnalysis. |
DataService Studio | DataService Studio dirancang untuk menyediakan kemampuan layanan dan berbagi data secara komprehensif bagi perusahaan serta membantu perusahaan mengelola layanan API untuk sistem internal dan eksternal secara terpusat. | Untuk informasi lebih lanjut, lihat Ikhtisar DataService Studio. |
5. Platform Terbuka
DataWorks menyediakan kemampuan terbuka yang memungkinkan sistem aplikasi Anda untuk dengan cepat berintegrasi dengan DataWorks. Anda dapat menggunakan DataWorks untuk mengelola proses-proses terkait data, mengatur tata kelola data, melakukan operasi O&M pada data, dan merespons secara cepat perubahan status bisnis dalam sistem aplikasi.
Item | Deskripsi | Referensi |
OpenAPI | Modul OpenAPI memungkinkan Anda memanggil operasi API DataWorks sehingga Anda dapat mengintegrasikan aplikasi Anda dengan DataWorks. Hal ini dapat membantu memfasilitasi pemrosesan data besar, mengurangi operasi manual dan operasi O&M, meminimalkan risiko data, serta mengurangi biaya bagi perusahaan. | |
OpenEvent | Modul OpenEvent memungkinkan Anda untuk berlangganan peristiwa perubahan DataWorks yang terkait dengan aplikasi Anda sehingga Anda dapat mendeteksi dan merespons perubahan tersebut secepat mungkin. | |
Ekstensi | Anda dapat menggunakan modul OpenEvent untuk berlangganan pesan peristiwa yang dihasilkan di ruang kerja DataWorks Anda. Anda dapat menggunakan modul Ekstensi untuk mendaftarkan program lokal Anda sebagai ekstensi guna mengelola titik ekstensi peristiwa dan proses. |
Lampiran: Hubungan antara DataWorks dan Hologres
Jika Anda menggunakan ruang kerja dalam mode dasar, hanya lingkungan produksi yang disediakan, dan Anda hanya dapat mengaitkan satu database Hologres dengan ruang kerja. Dalam topik ini, ruang kerja dalam mode standar digunakan.
DataWorks menyediakan beberapa kemampuan terkait Hologres. Misalnya, Anda dapat menjadwalkan tugas sinkronisasi batch Hologres, mengelola metadata Hologres, mengatur data Hologres, dan melakukan kontrol keamanan pada data Hologres di DataWorks. Komputasi data dan penyimpanan tugas-tugas tersebut masih dilakukan di Hologres. Jika Anda menggunakan ruang kerja dalam mode standar, Anda dapat mengaitkan instance Hologres yang berbeda dengan ruang kerja di lingkungan pengembangan dan produksi. Dengan cara ini, item seperti penyimpanan dan sumber daya diisolasi antara lingkungan pengembangan dan produksi.
Untuk informasi tentang cara menambahkan sumber data Hologres ke ruang kerja DataWorks dan mengaitkan sumber data dengan DataStudio, serta cara melihat instance Hologres yang digunakan di lingkungan berbeda, lihat Tambahkan Sumber Data Hologres.
Untuk informasi tentang logika penerbitan tugas yang dijadwalkan untuk dijalankan di DataWorks, lihat Logika Penerbitan Node Penjadwalan di DataWorks.
