全部产品
Search
文档中心

DataWorks:Pengambilan metadata

更新时间:Nov 13, 2025

DataWorks Data Map adalah platform terpusat untuk mengelola dan menemukan aset data. Platform ini membantu Anda memahami data perusahaan serta menemukan yang Anda butuhkan secara cepat dan akurat, layaknya mesin pencari. Fitur utamanya meliputi hal-hal berikut:

  • Ikhtisar data: Menyediakan tampilan statistik aset data Anda untuk membantu memperoleh wawasan secara cepat.

  • Pencarian kata kunci global: Gunakan satu titik masuk untuk menemukan tabel, bidang, atau istilah bisnis secara cepat.

  • Penyaringan dan penelusuran multidimensi: Gabungkan berbagai kondisi untuk melakukan pencarian data eksploratif dengan detail halus.

Batasan

  • Penghuni (tenant) yang telah membuat ruang kerja PAI dapat mencari dan melihat jenis aset AI yang sesuai, seperti set data, model AI, tugas algoritma, dan layanan model.

  • Pencarian kode hanya tersedia bagi pengguna DataWorks Edisi Standar ke atas.

Akses Peta Data

Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih Wilayah yang diinginkan. Di panel navigasi sebelah kiri, pilih Data Governance > Data Map. Pada halaman yang muncul, klik Go to Data Map.

Ikhtisar data: Peroleh wawasan dari perspektif makro

Ikhtisar data menampilkan penggunaan keseluruhan sumber data Anda.

  1. Di Home Page Data Map, klik Data Overview di samping Metadata Acquisition.

    image

  2. Di halaman ikhtisar data, Anda dapat melihat semua sumber daya engine di Wilayah saat ini.

    1. Metrik utama MaxCompute:

      Nama

      Deskripsi

      Total Projects

      Jumlah total proyek MaxCompute di Wilayah saat ini. Ini adalah metrik hampir real-time.

      Total Tables

      Jumlah total tabel MaxCompute di Wilayah saat ini. Ini adalah metrik offline dengan keterlambatan T+1 hari.

      Storage

      Total ukuran penyimpanan logis semua tabel di Wilayah saat ini. Ini mencakup file sementara dari tugas penjadwalan dan ruang penyimpanan yang belum dilepas setelah tabel dihapus. Ini adalah metrik offline dengan keterlambatan T+1 hari.

      Total APIs

      Jumlah total API MaxCompute yang dipublikasikan ke API Gateway di Wilayah saat ini.

      Storage Trend

      Grafik tren total penyimpanan logis untuk proyek MaxCompute di Wilayah saat ini. Ini mencakup file sementara dari tugas penjadwalan dan ruang penyimpanan yang belum dilepas setelah tabel dihapus. Ini adalah metrik offline dengan keterlambatan T+1 hari.

      Top Projects By Storage

      Peringkat proyek MaxCompute berdasarkan ukuran penyimpanan logis di Wilayah saat ini. Ini adalah metrik offline dengan keterlambatan T+1 hari. Klik proyek untuk melihat metadata-nya.

      Penting

      Penyimpanan proyek lebih besar daripada penyimpanan tabel karena mencakup penyimpanan sumber daya, Keranjang daur ulang, dan file sistem lainnya selain penyimpanan tabel.

      Top Tables By Storage

      Peringkat tabel MaxCompute berdasarkan ukuran. Ini adalah metrik offline dengan keterlambatan T+1 hari. Klik tabel untuk melihat metadata-nya.

      Penting

      Penyimpanan tabel dihitung berdasarkan penyimpanan logis, bukan penyimpanan fisik.

      Popular Tables

      Tabel yang paling banyak dilihat dalam 30 hari terakhir. Ini diperingkat berdasarkan jumlah tayangan halaman (PV) untuk halaman detail tabel di Data Map selama 30 hari terakhir. Ini adalah metrik hampir real-time.

    2. Metrik engine lainnya: Menampilkan informasi seperti jumlah total database, tabel, dan kluster.

Cara menemukan data: Dari pencarian hingga penemuan

Data Map menyediakan dua metode pencarian komplementer untuk memenuhi berbagai kebutuhan penemuan data Anda.

Pencarian kata kunci global

Pencarian global merupakan cara paling efisien untuk menemukan data ketika Anda sudah mengetahui apa yang dicari. Halaman utama juga menyediakan akses cepat ke item Recently Viewed, Followed Collections, dan halaman Manage Collections.

  1. Buka bilah pencarian: Temukan kotak pencarian di bagian atas halaman utama Data Map.

  2. Masukkan kata kunci: Pilih jenis metadata dan masukkan kata kunci, seperti nama tabel, nama bidang, atau komentar. Misalnya, Anda dapat memasukkan "user", "order", atau "user_info".

  3. Jalankan pencarian: Tekan Enter. Sistem akan mengembalikan daftar semua aset data yang relevan. Anda dapat mengklik aset tersebut untuk melihat detailnya.

Penyaringan dan penelusuran multi-dimensi

Untuk mempersempit pencarian atau menjelajahi data berdasarkan kategori bisnis, Anda dapat menggunakan halaman pencarian lanjutan. Bilah pencarian kata kunci global dari halaman utama juga tersedia di atas bilah navigasi.image

  1. Buka halaman pencarian: Di panel navigasi sebelah kiri, klik ikon pencarian image untuk menuju halaman pencarian lanjutan.

  2. Gabungkan kondisi penyaringan: Di sisi kiri halaman, Anda dapat menyaring hasil dengan memilih berbagai kondisi:

    • Type: Pilih jenis metadata. Jenis yang didukung meliputi Table, Code, Index, API, Dataset, dan Workspace.

    • Data Source: Saat Anda memilih Table, Anda dapat membatasi pencarian ke engine tertentu, seperti MaxCompute, EMR Hive, atau Hologres.

      Penting

      Jika jumlah sumber data melebihi batas tertentu, klik tombol More di pojok kanan atas untuk menampilkan sumber data yang disembunyikan.

    • Filter Conditions

      • Anda dapat menyaring berdasarkan proyek, pemilik, lingkungan, kluster, katalog data, database, dan lainnya.

        Kondisi penyaringan bervariasi tergantung pada jenis metadata.
      • Tag: Filter berdasarkan tag yang diterapkan selama proses tata kelola data. Anda dapat mengatur tag di halaman My Data > Data I Own atau pada detail metadata.

      • Category: Saring berdasarkan kategori bisnis. Untuk mengonfigurasi kategori bisnis, buka halaman Configuration Management > Category Navigation Configuration. Untuk informasi lebih lanjut, lihat Category Navigation Configuration.

Contoh:

Untuk menemukan semua tabel produksi di MaxCompute yang dimiliki oleh "Zhang San", atur Data Source menjadi MaxCompute, masukkan Zhang San untuk Owner, dan atur Environment menjadi Production.

FAQ

  • Q: Mengapa saya tidak dapat menemukan tabel yang saya cari?

    A: Jika Anda tidak dapat menemukan tabel di DataWorks Data Map, biasanya disebabkan oleh salah satu alasan berikut. Tinjau kemungkinan penyebab dan solusi berikut.

    • Kata kunci pencarian tidak cocok: Fitur pencarian mencocokkan nama tabel, deskripsi, dan nama bidang. Coba gunakan kata kunci yang lebih tepat atau sebagian.

    • Metadata belum disinkronkan: Setelah Anda menyambungkan sumber data MaxCompute atau DLF ke DataWorks, metadata dikumpulkan secara otomatis. Namun, mungkin terjadi penundaan sebelum metadata disinkronkan setelah Anda membuat tabel baru atau mengubah skema-nya.
      Solusi: Buka My Data > My Tools > Refresh Table Metadata. Setelah operasi berhasil, lakukan pencarian lagi.

    • Tabel disembunyikan: Tabel tersebut mungkin diatur ke status "hidden", sehingga tidak dapat ditemukan melalui pencarian. Jika status tabel adalah "hidden", tidak ada yang dapat melihatnya. Jika statusnya "project-only", hanya anggota ruang kerja saat ini yang dapat melihatnya.

    • Izin tidak mencukupi: Secara default, cakupan pencarian hanya mencakup ruang kerja saat ini dan proyek yang telah diotorisasi. Jika tabel target milik akun lain atau ruang kerja yang tidak diotorisasi, tabel tersebut tidak akan muncul dalam hasil pencarian. Selain itu, jika Anda tidak memiliki izin kueri untuk suatu tabel, tabel tersebut tidak terlihat di Data Map secara default. Hal ini terutama berlaku untuk ruang kerja mode standar.

      Solusi: Hubungi pemilik tabel atau administrator untuk meminta izin yang diperlukan, atau pastikan Anda telah ditambahkan sebagai anggota ke proyek yang sesuai.