Katalog data merupakan workbench metadata terpadu Anda di DataAnalysis. Katalog ini mengintegrasikan metadata dari MaxCompute, Hologres, dan Data Lake Formation (DLF), memungkinkan Anda membuat tabel, mengelola tampilan, serta menghasilkan kueri SQL tanpa meninggalkan DataWorks.
Akses katalog data
Masuk ke DataWorks DataAnalysis, alihkan ke wilayah target, lalu klik Enter Data Analysis.
-
Jika Anda melihat Go To New DataAnalysis di bilah navigasi, klik untuk beralih ke halaman DataAnalysis versi baru.
-
Jika Anda melihat Return To Legacy DataAnalysis di bilah navigasi, berarti Anda sudah berada di halaman DataAnalysis versi baru.
Tambahkan katalog data
Langkah-langkahnya berbeda tergantung apakah Anda pengguna DataAnalysis baru atau yang sudah ada.
Tambahkan katalog data sebagai pengguna baru
-
Di katalog data, temukan jenis sumber data yang akan ditambahkan. Klik ikon
di samping nama jenis sumber data untuk membuka halaman Add Data Catalog. -
Temukan instans atau sumber data yang akan ditambahkan. Di kolom Operation, klik Add.
Untuk menghapus instans atau sumber data yang tidak lagi diperlukan, gunakan kolom Operation yang sama.
Tambahkan katalog data sebagai pengguna yang sudah ada
Klik ikon
di pojok kanan atas katalog, lalu pilih jenis katalog:
| Catalog type | What it adds |
|---|---|
| DataMap - Metadata | Metadata tabel yang dikumpulkan di Data Map. Setiap sumber data atau resource komputasi ditambahkan sebagai satu set data. |
| DataMap - Data Album | Album data dari Data Map, yang mengelompokkan tabel berdasarkan subjek. Setiap album data ditambahkan sebagai satu set data. |
| My Favorites | Tabel yang telah Anda tandai favorit di katalog data. |
| My MaxCompute tables | Semua tabel MaxCompute yang dimiliki oleh akun log masuk saat ini. |
| Public Tables | Set data publik yang disediakan oleh DataWorks, untuk digunakan dengan EMR Spark SQL, MaxCompute, dan Hologres. |
Jumlah maksimum set data adalah 12. Hapus set data yang sudah ada sebelum menambahkan yang baru jika Anda telah mencapai batas ini.
Kelola katalog data
Berikut ini hanya berlaku untuk katalog data pengguna baru.
Gunakan katalog data untuk mengelola objek data, termasuk tabel, tampilan, tabel eksternal, resource, dan fungsi. Instruksinya berbeda-beda tergantung mesinnya:
| Engine | Reference |
|---|---|
| MaxCompute | Kelola katalog data MaxCompute |
| Hologres | Kelola katalog data Hologres |
| DLF | Kelola katalog data DLF Catalog |
Hasilkan SQL kueri
Anda dapat dengan cepat menghasilkan pernyataan kueri SQL berdasarkan tabel data, lalu mengonfigurasi dan menjalankan pernyataan tersebut. Untuk informasi selengkapnya, lihat Buat kueri SQL.
-
Di katalog data, temukan sumber data yang akan dikueri. Klik ikon
di samping sumber data, lalu temukan tabel di daftar Table. -
Klik kanan tabel tersebut dan pilih Generate SQL Statement. Skrip SQL yang dihasilkan akan terbuka di halaman pengeditan SQL.
-
Sesuaikan skrip SQL sesuai kebutuhan.
-
Klik Run Configuration di panel sisi kanan. Atur parameter seperti Computing Resource dan Script Parameters, lalu jalankan kueri.
Lampiran
Otentikasi dan otorisasi MaxCompute
Jika Anda menggunakan pengguna Resource Access Management (RAM) atau peran RAM untuk melihat data MaxCompute di katalog data, berikan izin MaxCompute yang diperlukan terlebih dahulu. Jika model Lapisan 3 diaktifkan untuk sumber data atau proyek MaxCompute, berikan juga izin untuk melihat metadata skema.
Jika proyek MaxCompute berisi beberapa skema, berikan izin metadata untuk semua skema agar daftar skema lengkap ditampilkan di halaman detail proyek di katalog data.
Berikan izin kepada pengguna RAM:
GRANT DESCRIBE ON SCHEMA <Schema_Name> TO USER RAM$<Alibaba_Cloud_Account_Name>:<RAM_User_Name>;
Berikan izin kepada peran RAM:
GRANT DESCRIBE ON SCHEMA <Schema_Name> TO USER `RAM$<Alibaba_Cloud_Account_Name>:role/<RAM_Role_Name>`;