Data Catalog adalah workbench metadata terpadu untuk persiapan pengembangan Anda. Fitur ini mengintegrasikan metadata dari berbagai sumber data, seperti MaxCompute, Hologres, dan DLF, sehingga Anda dapat menyelesaikan semua tugas persiapan—seperti membuat tabel dan mengelola tampilan—tanpa keluar dari DataWorks dan tetap fokus pada pengembangan inti.
Fitur utama
Manajemen terpadu: Kelola dan cari tabel, tampilan, fungsi, serta resource dari berbagai sumber data secara terpusat.
Pembuatan tabel cepat: Buat skema tabel langsung di DataWorks tanpa beralih ke konsol lain.
Pembuatan berbasis DDL: Gunakan pernyataan SQL Data Definition Language (DDL) native untuk kontrol yang fleksibel.
Pembuatan visual: Isi formulir untuk proses yang sederhana dan intuitif.
Pembuatan dibantu Copilot: Jelaskan kebutuhan Anda dalam bahasa alami dan biarkan AI menghasilkan tabel tersebut.
Sinkronisasi satu klik: Jalankan tugas sinkronisasi data antar sumber data seperti MaxCompute dan Hologres dengan cepat untuk menyederhanakan proses.
Eksplorasi cepat: Pratinjau detail skema tabel untuk memahami data Anda dengan cepat.
Katalog data yang didukung
Tabel berikut mencantumkan jenis sumber data yang didukung oleh Data Catalog dan cara menambahkannya.
Data Catalog | Tambahkan dari sumber data yang disambungkan ke ruang kerja | Tambahkan dari sumber data yang sudah ada di akun Anda |
MaxCompute (proyek internal dan eksternal) | ||
Hologres (database internal dan eksternal) | ||
DLF Catalog (DLF 1.0 dan DLF 2.0) | ||
Hive (EMR Hive) | ||
Lindorm | ||
AnalyticDB MySQL | ||
AnalyticDB PostgreSQL | ||
StarRocks | ||
AI Catalog (set data AI dan model AI) | Sistem secara otomatis membaca data dari ruang kerja AI yang memiliki nama sama dengan ruang kerja DataWorks saat ini. |
Otorisasi dan autentikasi
Kemampuan Data Catalog untuk membaca data dari sumber data bergantung pada cara sumber data tersebut ditambahkan. Aturan berikut berlaku:
Saat Anda menambahkan instans sumber data yang terhubung ke ruang kerja, Data Catalog menggunakan informasi identitas dari konfigurasi sumber data untuk membaca datanya.
Saat Anda menambahkan instans sumber data yang sudah ada dari akun pribadi Anda, Data Catalog menggunakan informasi identitas pribadi Anda untuk membaca datanya.
Jika Anda menggunakan Pengguna Resource Access Management (RAM) atau Peran RAM untuk melihat data MaxCompute di Data Catalog, Anda harus terlebih dahulu mendapatkan izin MaxCompute yang diperlukan. Jika model Lapisan 3 diaktifkan untuk sumber data atau proyek MaxCompute yang ditambahkan, Anda juga harus memberikan izin kepada Pengguna RAM atau Peran RAM tersebut untuk melihat metadata skema.
CatatanJika sebuah proyek MaxCompute berisi beberapa skema, Anda harus memberikan izin metadata untuk semua skema agar dapat melihat daftar skema lengkap di halaman detail proyek di Data Catalog.
Berikan izin kepada Pengguna RAM:
GRANT DESCRIBE ON SCHEMA <schema_name> TO USER RAM$<alibaba_cloud_account_name>:<ram_user_name>;Berikan izin kepada Peran RAM:
GRANT DESCRIBE ON SCHEMA <schema_name> TO USER `RAM$<alibaba_cloud_account_name>:role/<ram_role_name>`;
Mengakses Katalog Data
Fitur ini hanya tersedia di ruang kerja yang menggunakan Use Data Studio (New Version).
Buka halaman Workspaces di Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Temukan ruang kerja yang diinginkan, lalu pilih di kolom Actions.
Di panel navigasi sebelah kiri, klik ikon
untuk membuka Data Catalog.
Tambahkan katalog data
Anda dapat membuat struktur direktori kustom untuk organisasi yang lebih baik. Lakukan langkah-langkah berikut:
Di Data Catalog, temukan jenis sumber data yang ingin Anda tambahkan, lalu klik ikon
di sebelah namanya untuk membuka halaman penambahan.Temukan instans atau sumber data yang ingin Anda tambahkan, lalu klik Add di kolom Actions.
Katalog data yang ditambahkan dari sumber data yang sudah ada di ruang kerja DataWorks terlihat oleh semua anggota ruang kerja.
Katalog data yang ditambahkan dari sumber data yang sudah ada di akun Anda hanya terlihat oleh Anda.
Saat Anda menambahkan katalog data dari sumber data yang sudah ada di akun Anda, halaman daftar hanya menampilkan instans sumber data yang berada di wilayah yang sama dengan proyek DataWorks dan yang Anda miliki izin aksesnya.
Kelola katalog data
Sembunyikan katalog data
Selama pengembangan, Anda dapat menyembunyikan katalog data yang tidak terkait dengan tugas Anda saat ini.
Temukan katalog data di struktur direktori sebelah kiri, lalu klik ikon
di pojok kanan atas.Di kotak dialog yang muncul, klik ikon
di sebelah nama engine untuk menyembunyikan semua katalog data untuk engine tersebut.CatatanUntuk menampilkan kembali katalog data suatu engine, klik area kosong di sebelah nama engine tersebut di kotak dialog.
Hapus katalog data
Jika Anda tidak lagi memerlukan katalog data yang telah ditambahkan, Anda dapat menghapusnya.
Di struktur direktori sebelah kiri, temukan katalog data yang ingin Anda hapus. Di kolom Actions, klik Remove atau Detach Data Catalog.
Buat dan kelola objek data
Di halaman Data Catalog, Anda dapat menemukan dan memperluas katalog yang telah ditambahkan untuk membuat atau mengelola objek datanya. Untuk informasi selengkapnya, lihat dokumen pada tabel berikut.
Data Catalog | Deskripsi | Referensi |
MaxCompute | Buat dan kelola objek data seperti tabel, tampilan, tabel eksternal, resource, dan fungsi. | |
Hologres | Buat dan kelola objek data seperti tabel dan tampilan. | |
DLF Catalog | Buat dan kelola metadata tabel database. | |
Hive | Buat dan kelola objek data tabel. | |
AnalyticDB MySQL | Buat dan kelola objek data tabel. | |
AnalyticDB PostgreSQL | Buat dan kelola objek data tabel. | |
StarRocks | Buat dan kelola objek data tabel dan tampilan. | |
AI Catalog | Kelola metadata set data dan model AI di AI Catalog. |