全部产品
Search
文档中心

DataWorks:Detail Skema Tabel Open Data

更新时间:Dec 14, 2025

DataWorks Open Data menyediakan tabel dan view yang dapat digunakan untuk mengumpulkan metadata. Topik ini mencantumkan tabel dan view yang tersedia serta menjelaskan skemanya.

Metadata

DataWorks menghasilkan kumpulan tabel metadata dan tabel ringkasan metrik contoh berdasarkan metadata dari tabel, tugas, instans, ruang kerja, anggota, dan proyek penyewa Anda. Skema tabel dapat berubah seiring perkembangan kebutuhan bisnis. Untuk informasi terbaru, rujuk antarmuka sistem.

Metadata Aset Data

Detail Masalah Tabel Aset (asset_table_issues)

Field partisi: dt

Deskripsi: Masalah tata kelola data terperinci untuk tabel.

Field

Type

Deskripsi

tenant_id

string

ID penyewa DataWorks

meta_entity_id

string

ID entitas metadata yang sesuai

uuid

string

kunci unik tabel

meta_entity_type

string

Tipe metadata yang sesuai, seperti maxcompute-table

entity_type

string

Tipe entitas, seperti table, view, atau materialized_view

account_id

string

Akun Alibaba Cloud yang memiliki aset tersebut

datasource_type

string

Tipe sumber data, seperti EMR atau MC

datasource_id

string

Nama engine (MC: projectName, EMR: clusterId, Holo: databaseName)

catalog_name

string

Nama katalog DLF ketika sumber metadata adalah DLF

database_name

string

Nama database (EMR dbName)

schema_name

string

Nama skema

rule_id

string

Identifikasi aturan tata kelola

rule_name_zh

string

Nama aturan tata kelola dalam bahasa Mandarin

rule_name_en

string

Nama aturan tata kelola dalam bahasa Inggris

category

string

Kategori dimensi

deduct_score_tenant

string

Skor pengurangan global, dibulatkan hingga 4 tempat desimal

deduct_score_owner

string

Skor pengurangan individu, dibulatkan hingga 4 tempat desimal

cost

string

Sumber daya yang terbuang

project_id

string

Ruang proyek DataWorks

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD

Detail Profil Tabel Aset (asset_table_profiles)

Field partisi: dt

Deskripsi: Metrik terperinci untuk tabel.

Field

Type

Deskripsi

tenant_id

bigint

ID penyewa sumber

meta_entity_id

string

ID entitas metadata yang sesuai

meta_entity_type

string

Tipe metadata yang sesuai, seperti maxcompute-table

entity_type

string

Tipe entitas, seperti table, view, atau materialized_view

account_id

string

Akun Alibaba Cloud yang memiliki aset tersebut

datasource_type

string

Tipe sumber data, seperti EMR atau MC

datasource_id

string

Nama engine (MC: projectName, EMR: clusterId, Holo: databaseName)

catalog_name

string

Nama katalog DLF ketika sumber metadata adalah DLF

database_name

string

Nama database (EMR dbName)

schema_name

string

Nama skema

uuid

string

kunci unik tabel

name

string

Nama tabel

owner

string

Pemilik aset

last_access_timestamp

bigint

Waktu akses tabel paling baru

meta_modified_timestamp

bigint

Timestamp modifikasi metadata tabel (13 digit)

data_modified_timestamp

bigint

Timestamp modifikasi data tabel (13 digit)

create_timestamp

bigint

Waktu pembuatan tabel

comment

string

Komentar tabel

partition_keys

string

Kunci partisi

tags

string

Tag aset

governance_rule_finding_count

bigint

Jumlah masalah aturan tata kelola

governance_rule_finding_history_count

string

Jumlah historis aturan tata kelola aset

governance_health_score

string

Skor kesehatan tata kelola aset

governance_health_level

string

Tingkat kesehatan tata kelola aset

is_partitioned

bigint

Apakah tabel dipartisi

content_size

bigint

Ukuran logis

record_num

bigint

Jumlah catatan

life_cycle

string

Lifecycle

partition_count

bigint

Jumlah partisi

view_count_monthly

bigint

Jumlah tampilan dalam sebulan terakhir

access_count

bigint

Jumlah akses

upstream_table_count

bigint

Jumlah tabel hulu

upstream_table_detail

string

Detail tabel hulu

downstream_table_count

bigint

Jumlah tabel hilir

downstream_table_detail

string

Detail tabel hilir

producing_project_ids

string

Daftar ruang kerja yang terlibat dalam produksi tabel

producing_tasks_count

bigint

Jumlah node yang terlibat dalam produksi tabel

producing_tasks_detail

string

Detail node yang terlibat dalam produksi tabel

using_tasks_count

bigint

Jumlah node yang menggunakan tabel

using_tasks_detail

string

Detail node yang menggunakan tabel

quality_rule_count

bigint

Jumlah aturan kualitas

quality_monitor_count

bigint

Jumlah metrik pemantauan kualitas

quality_rule_7_days_failed_count

bigint

Jumlah aturan kualitas yang gagal

quality_monitor_7_days_failed_count

bigint

Jumlah metrik pemantauan kualitas yang gagal

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD

Detail Masalah Tugas Aset (asset_task_issues)

Field partisi: dt

Deskripsi: Masalah tata kelola data terperinci untuk tugas.

Field

Type

Deskripsi

tenant_id

string

ID penyewa DataWorks

node_id

string

ID node penjadwalan

node_name

string

Nama node

node_type

string

Tipe tugas, seperti SQL, SQLCost, LOT, atau CUPID

node_owner

string

ID dasar pemilik

priority

string

Prioritas

rule_id

string

Identifikasi aturan tata kelola

rule_name_zh

string

Nama aturan tata kelola dalam bahasa Mandarin

rule_name_en

string

Nama aturan tata kelola dalam bahasa Inggris

category

string

Domain tata kelola

deduct_score_tenant

string

Skor pengurangan global, dibulatkan hingga 4 tempat desimal

deduct_score_owner

string

Skor pengurangan individu, dibulatkan hingga 4 tempat desimal

cost

string

Manfaat tata kelola

project_id

string

ID proyek DataWorks

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD

Detail Profil Tugas Aset (asset_task_profiles)

Field partisi: dt

Deskripsi: Metrik terperinci untuk tugas.

Field

Type

Deskripsi

tenant_id

bigint

ID penyewa sumber

data_asset_id

string

ID aset dalam modul, sesuai dengan task.id

name

string

Nama aset, sesuai dengan task.name

project_id

bigint

Ruang kerja

project_env

string

Lingkungan: PROD untuk produksi, DEV untuk pengembangan

owner

string

Pemilik aset

create_user

string

Pembuat

create_time

bigint

Waktu pembuatan

modify_user

string

Pengubah

modify_time

bigint

Waktu modifikasi

trigger_type

string

Tipe pemicu: Scheduler untuk pemicu terjadwal, Manual untuk pemicu manual

trigger_recurrence_type

string

Normal untuk eksekusi reguler, Manual untuk tugas satu kali, Pause untuk dijeda, Skip untuk dry-run

trigger_cron

string

Ekspresi cron

type

bigint

Tipe eksekusi kode. Untuk detailnya, lihat Pengembangan Node untuk nilai encoding node.

script_parameters

string

Informasi parameter

priority

bigint

Prioritas tugas, berkisar dari 1 (terendah) hingga 8 (tertinggi). Prioritas default adalah 1.

trigger_start_time

bigint

Tanggal mulai penjadwalan

trigger_end_time

bigint

Tanggal akhir penjadwalan

runtime_resource_group_id

bigint

ID kelompok sumber daya yang ditetapkan ke node

runtime_cu

string

Compute CU

baseline_id

bigint

ID garis dasar yang ditetapkan ke node

rerun_times

bigint

Jumlah maksimum rerun yang diizinkan

rerun_interval

bigint

Interval rerun dalam milidetik

rerun_mode_type

string

AllAllowed: rerun diizinkan saat sukses atau gagal; FailureAllowed: rerun hanya saat gagal; AllDenied: tidak ada rerun yang diizinkan

tags

string

Tag aset

tags_count

bigint

Jumlah tag aset

input_table_count

bigint

Jumlah tabel input

output_table_count

bigint

Jumlah tabel output

input_table_detail

string

Detail tabel input

output_table_detail

string

Detail tabel output

upstream_node_count

bigint

Jumlah node hulu

downstream_node_count

bigint

Jumlah node hilir

governance_rule_finding_count

bigint

Jumlah masalah aturan tata kelola

governance_rule_finding_history_count

string

Jumlah historis aturan tata kelola aset

governance_health_score

string

Skor kesehatan aset

governance_health_level

string

Tingkat kesehatan aset

engine_datasource_id

string

ID engine komputasi

engine_instance_count

bigint

Jumlah pekerjaan engine komputasi

engine_instance_run_time

bigint

Waktu proses pekerjaan engine komputasi

engine_instance_comput_volume_cost

string

Volume komputasi

engine_instance_cu_cost

string

CU komputasi

engine_instance_cpu_cost

string

Konsumsi CPU

engine_instance_mem_cost

string

Konsumsi memori

engine_instance_exist_data_skew

bigint

Kemiringan data

engine_instance_suggestions

string

Saran kemiringan

engine_instance_data_skew_ids

string

ID pekerjaan kemiringan data

engine_instance_ids

string

ID pekerjaan

task_instance_wait_time_cost_sum

bigint

Total biaya waktu tunggu

task_instance_wait_time_cost_max

bigint

Biaya waktu tunggu instans maksimum

task_instance_run_time_cost_sum

bigint

Total biaya waktu proses

task_instance_run_time_cost_max

bigint

Biaya waktu proses maksimum

task_instance_7_days_wait_time_cost_max

bigint

Biaya waktu tunggu instans maksimum selama 7 hari terakhir

task_instance_7_days_run_time_cost_max

bigint

Biaya waktu proses instans maksimum selama 7 hari terakhir

task_instance_count

bigint

Jumlah instans

task_instance_7_days_failed_count

bigint

Jumlah instans yang gagal

task_instance_7_days_failed_day_count

bigint

Jumlah hari dengan kegagalan

task_instance_7_days_frezeed_day_count

bigint

Jumlah hari dibekukan

task_instance_7_days_dry_run_day_count

bigint

Jumlah hari dry-run

quality_monitor_count

bigint

Jumlah metrik pemantauan Kualitas Data

quality_monitor_7_days_failed_count

bigint

Jumlah metrik pemantauan Kualitas Data yang gagal

di_task_resource_group_id

string

ID kelompok sumber daya integrasi data yang ditetapkan ke node

di_task_is_public_network

bigint

Apakah tugas integrasi data menggunakan Lalu lintas internet

di_task_concurrency

bigint

Konkurensi

di_task_total_records

bigint

Jumlah catatan yang disinkronkan

di_task_total_bytes

bigint

Jumlah data yang disinkronkan

di_task_source_type

string

Tipe sumber

di_task_target_type

string

Tipe target

di_task_run_time_cost

bigint

Durasi eksekusi tugas integrasi data

di_task_wait_time_cost

bigint

Durasi menunggu tugas integrasi data

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD

Kualitas Data

Hasil Aturan Kualitas Data (quality_rule_results)

Field partisi: dt

Deskripsi: Hasil aturan Kualitas Data.

Field

Type

Deskripsi

id

bigint

ID kunci utama

scan_run_id

bigint

ID instans pemantauan Kualitas Data

rule_id

bigint

ID aturan

rule_name

string

Nama aturan

status

string

Hasil validasi aturan: Pass, Error, Warn, Fail, atau Running

severity

string

Tingkat keparahan aturan: High atau Normal

create_time

bigint

Waktu pembuatan

modify_time

bigint

Waktu modifikasi terbaru

spec

string

Spesifikasi instans aturan

tags

array<string>

Tag instans aturan

tenant_id

bigint

ID penyewa DataWorks

project_id

bigint

ID ruang proyek DataWorks

meta_entity_id

string

Identifier unik entitas geochart

dt

string

Partisi tanggal, format YYYYMMDD, rentang: [TODAY-D, TODAY-1D]

Detail Metrik Aturan Kualitas Data (quality_rules)

Field partisi: dt

Deskripsi: Metrik aturan Kualitas Data terperinci.

Field

Type

Deskripsi

id

bigint

ID kunci utama

scan_id

bigint

ID pemantauan Kualitas Data

rule_name

string

Nama aturan

enabled

boolean

Apakah aturan diaktifkan

severity

string

Tingkat keparahan bisnis aturan: High atau Normal

create_time

bigint

Waktu pembuatan

modify_time

bigint

Waktu modifikasi terbaru

spec

string

Spesifikasi aturan

tags

array<string>

Tag aturan

tenant_id

bigint

ID penyewa DataWorks

project_id

bigint

ID ruang proyek DataWorks

meta_entity_id

string

Identifier unik entitas peta

pass_count

int

Jumlah kali aturan lulus validasi

warn_count

int

Jumlah kali aturan memicu ambang batas oranye

error_count

int

Jumlah kali aturan memicu ambang batas merah

fail_count

int

Jumlah kali aturan gagal validasi

dt

string

Partisi tanggal, format YYYYMMDD, rentang: [TODAY-D, TODAY-1D]

Instans Pekerjaan Pemantauan Kualitas Data (quality_scan_runs)

Field partisi: dt

Deskripsi: Instans pekerjaan pemantauan Kualitas Data.

Field

Type

Deskripsi

id

bigint

ID kunci utama

scan_id

bigint

ID pemantauan Kualitas Data

name

string

Nama pemantauan

status

string

Status instans pemantauan: Pass, Warn, Error, Fail, atau Running

post_action_type

string

Aksi setelah validasi pemantauan: Alert atau BlockTaskInstance

data_filter

string

Rentang data aktual yang digunakan selama sampling

trigger_time

bigint

Waktu pemicu terjadwal yang digunakan oleh tugas

trigger_type

string

Metode pemicu pemantauan Kualitas Data: ByManual, BySchedule, atau ByQualityNode

create_time

bigint

Waktu pembuatan

modify_time

bigint

Waktu pembaruan terbaru

datasource_id

bigint

ID sumber data tabel

datasource_type

string

Tipe sumber data

computing_resource_id

bigint

ID engine komputasi

compute_resource_option

string

Sumber daya komputasi yang digunakan untuk pemantauan Kualitas Data

spec

string

Spesifikasi pemantauan Kualitas Data

tenant_id

bigint

ID penyewa DataWorks

project_id

bigint

ID ruang proyek DataWorks

owner

string

Pemilik pemantauan Kualitas Data

task_id

bigint

ID tugas penjadwalan

task_instance_id

bigint

ID instans tugas penjadwalan

meta_entity_id

string

Identifier unik entitas peta

table_name

string

Nama tabel

catalog_name

string

Nama katalog data tabel

schema_name

string

Nama skema tabel

database_name

string

Nama database tabel

cluster_id

string

ID kluster tabel

dt

string

Partisi tanggal, format YYYYMMDD, rentang: [TODAY-D, TODAY-1D]

Detail Metrik Pekerjaan Pemantauan Kualitas Data (quality_scans)

Field partisi: dt

Deskripsi: Metrik pekerjaan pemantauan Kualitas Data terperinci.

Field

Type

Deskripsi

id

bigint

ID kunci utama

name

string

Nama pemantauan

data_filter_type

string

Tipe rentang data: ByPartition atau ByWhere

data_filter

string

Ekspresi rentang data

trigger_type

string

Metode pemicu pemantauan Kualitas Data: ByManual, BySchedule, atau ByQualityNode

create_time

bigint

Waktu pembuatan

modify_time

bigint

Waktu pembaruan terbaru

computing_resource_id

bigint

ID engine komputasi

compute_resource_option

string

Sumber daya komputasi yang digunakan untuk pemantauan Kualitas Data

spec

string

Spesifikasi pemantauan Kualitas Data

related_tasks

array<bigint>

Tugas penjadwalan yang terkait dengan pekerjaan pemantauan

tenant_id

bigint

ID penyewa DataWorks

project_id

bigint

ID ruang proyek DataWorks

owner

string

Pemilik pemantauan Kualitas Data

datasource_id

string

ID sumber data tabel

datasource_type

string

Tipe sumber data

meta_entity_id

string

Identifier unik entitas peta

table_name

string

Nama tabel

catalog_name

string

Nama katalog data tabel

schema_name

string

Nama skema tabel

database_name

string

Nama database tabel

cluster_id

string

ID kluster tabel

related_scheduler_task_count

int

Jumlah tugas penjadwalan terkait

rule_count

int

Jumlah aturan terkait

high_severity_rule_count

int

Jumlah aturan kuat terkait

normal_severity_rule_count

int

Jumlah aturan lunak terkait

enabled_rule_count

int

Jumlah aturan yang diaktifkan

enabled_high_severity_rule_count

int

Jumlah aturan kuat yang diaktifkan

enabled_normal_severity_rule_count

int

Jumlah aturan lunak yang diaktifkan

rule_instance_count

int

Jumlah instans aturan hari ini

high_severity_rule_instance_count

int

Jumlah instans aturan kuat hari ini

normal_severity_rule_instance_count

int

Jumlah instans aturan lunak hari ini

high_severity_rule_instance_pass_count

int

Jumlah instans aturan kuat yang lulus validasi hari ini

high_severity_rule_instance_warn_count

int

Jumlah instans aturan kuat dengan peringatan oranye hari ini

high_severity_rule_instance_error_count

int

Jumlah instans aturan kuat dengan peringatan merah hari ini

high_severity_rule_instance_fail_count

int

Jumlah instans aturan kuat yang gagal validasi hari ini

normal_severity_rule_instance_pass_count

int

Jumlah instans aturan lunak yang lulus validasi hari ini

normal_severity_rule_instance_warn_count

int

Jumlah instans aturan lunak dengan peringatan oranye hari ini

normal_severity_rule_instance_error_count

int

Jumlah instans aturan lunak dengan peringatan merah hari ini

normal_severity_rule_instance_fail_count

int

Jumlah instans aturan lunak yang gagal validasi hari ini

block_task_instance_count

int

Jumlah tugas penjadwalan yang diblokir hari ini

alert_rule_count

int

Jumlah langganan peringatan yang dikonfigurasi

sms_alert_rule_count

int

Jumlah langganan peringatan SMS yang dikonfigurasi

mail_alert_rule_count

int

Jumlah langganan peringatan email yang dikonfigurasi

phone_alert_rule_count

int

Jumlah langganan peringatan telepon yang dikonfigurasi

ding_alert_rule_count

int

Jumlah langganan peringatan DingTalk yang dikonfigurasi

feishu_alert_rule_count

int

Jumlah langganan peringatan Lark yang dikonfigurasi

weixin_alert_rule_count

int

Jumlah langganan peringatan WeChat yang dikonfigurasi

webhook_alert_rule_count

int

Jumlah langganan peringatan webhook kustom yang dikonfigurasi

alert_times

int

Jumlah peringatan yang dipicu hari ini

sms_alert_times

int

Jumlah peringatan SMS yang dipicu hari ini

mail_alert_times

int

Jumlah peringatan email yang dipicu hari ini

phone_alert_times

int

Jumlah peringatan telepon yang dipicu hari ini

ding_alert_times

int

Jumlah peringatan DingTalk yang dipicu hari ini

feishu_alert_times

int

Jumlah peringatan Lark yang dipicu hari ini

weixin_alert_times

int

Jumlah peringatan WeChat yang dipicu hari ini

webhook_alert_times

int

Jumlah peringatan webhook kustom yang dipicu hari ini

dt

string

Partisi tanggal, format YYYYMMDD, rentang: [TODAY-D, TODAY-1D]

Detail Metrik Tabel Kualitas Data (table_quality_summary)

Field partisi: dt

Deskripsi: Metrik tabel Kualitas Data terperinci.

Field

Type

Deskripsi

meta_entity_id

string

Identifier unik entitas tabel geochart

project_id

bigint

ID ruang proyek DataWorks

table_name

string

Nama tabel

schema_name

string

Nama skema tabel

database_name

string

Nama database tabel

catalog_name

string

Nama katalog data tabel

datasource_id

bigint

ID sumber data tabel; NULL jika Kualitas Data tidak dikonfigurasi

tenant_id

bigint

ID penyewa DataWorks

owner

string

Pemilik tabel

scan_count

int

Jumlah pekerjaan pemantauan Kualitas Data yang dikonfigurasi

scheduler_related_scan_count

int

Jumlah pekerjaan pemantauan Kualitas Data yang terkait dengan penjadwalan

scan_run_count

int

Jumlah instans pekerjaan pemantauan Kualitas Data hari ini

alert_scan_run_count

int

Jumlah instans pekerjaan pemantauan Kualitas Data yang memicu peringatan hari ini

block_task_instance_scan_run_count

int

Jumlah instans pekerjaan pemantauan Kualitas Data yang memicu pemblokiran tugas penjadwalan hari ini

rule_count

int

Jumlah aturan yang dikonfigurasi

enabled_rule_count

int

Jumlah aturan yang diaktifkan

high_severity_rule_count

int

Jumlah aturan kuat yang dikonfigurasi

normal_severity_rule_count

int

Jumlah aturan lunak yang dikonfigurasi

rule_instance_count

int

Jumlah instans aturan hari ini

high_severity_rule_instance_count

int

Jumlah instans aturan kuat hari ini

normal_severity_rule_instance_count

int

Jumlah instans aturan lunak hari ini

high_severity_rule_instance_pass_count

int

Jumlah validasi aturan kuat yang lulus hari ini

high_severity_rule_instance_warn_count

int

Jumlah validasi aturan kuat dengan peringatan oranye hari ini

high_severity_rule_instance_error_count

int

Jumlah validasi aturan kuat dengan peringatan merah hari ini

high_severity_rule_instance_fail_count

int

Jumlah validasi aturan kuat yang gagal hari ini

normal_severity_rule_instance_pass_count

int

Jumlah validasi aturan lunak yang lulus hari ini

normal_severity_rule_instance_warn_count

int

Jumlah validasi aturan lunak dengan peringatan oranye hari ini

normal_severity_rule_instance_error_count

int

Jumlah validasi aturan lunak dengan peringatan merah hari ini

normal_severity_rule_instance_fail_count

int

Jumlah validasi aturan lunak yang gagal hari ini

dt

string

Partisi tanggal, format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D]

Katalog Data (catalogs)

Field

Type

Deskripsi

datasource_type

string

Tipe sumber data, seperti dlf atau starrocks.

datasource_id

string

Identifier sumber data, seperti ID kluster StarRocks atau ID akun Alibaba Cloud DLF.

name

string

Nama katalog data.

type

string

Tipe katalog data, seperti Hive atau Jdbc.

comment

string

Komentar katalog data.

location

string

Jalur katalog.

properties

string

Properti dan parameter (string JSON).

owner

string

Pemilik katalog data. Bergantung pada tipe sumber data, nilai ini bisa berupa UID akun Alibaba Cloud atau akun sistem database.

create_timestamp

bigint

Timestamp pembuatan (13 digit).

update_timestamp

bigint

Timestamp modifikasi (13 digit).

meta_entity_id

string

Identifier unik katalog data (ramah API dan sesuai dengan standar ID entitas metadata).

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Database (databases)

Field

Type

Deskripsi

datasource_type

string

Tipe sumber data, seperti dlf, starrocks, maxcompute, holodb, atau mysql.

datasource_id

string

Identifier sumber data, seperti ID kluster StarRocks, ID akun Alibaba Cloud DLF atau MaxCompute, atau ID instans RDS.

catalog_name

string

Nama katalog data. Diisi hanya jika tipe sumber data mendukung katalog.

name

string

Nama database.

type

string

Tipe database.

comment

string

Komentar database.

location

string

Jalur database.

properties

string

Properti dan parameter (string JSON).

owner

string

Pemilik database. Bergantung pada tipe sumber data, nilai ini bisa berupa UID akun Alibaba Cloud atau akun sistem database.

is_external

boolean

Apakah database bersifat eksternal.

create_timestamp

bigint

Timestamp pembuatan (13 digit).

update_timestamp

bigint

Timestamp modifikasi (13 digit).

meta_entity_id

string

Identifier unik database (ramah API dan sesuai dengan standar ID entitas metadata).

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Skema Data (schemas)

Field

Type

Deskripsi

datasource_type

string

Tipe sumber data, seperti holodb, maxcompute, atau postgresql.

datasource_id

string

Identifier sumber data, seperti ID instans RDS atau ID akun Alibaba Cloud MaxCompute.

catalog_name

string

Nama katalog data. Diisi hanya jika tipe sumber data mendukung katalog.

database_name

string

Nama database.

name

string

Nama skema.

type

string

Tipe skema.

comment

string

Komentar.

properties

string

Properti dan parameter (string JSON).

owner

string

Pemilik skema. Bergantung pada tipe sumber data, nilai ini bisa berupa UID akun Alibaba Cloud atau akun sistem database.

create_timestamp

bigint

Timestamp pembuatan (13 digit).

update_timestamp

bigint

Timestamp modifikasi (13 digit).

meta_entity_id

string

Identifier unik skema (ramah API dan sesuai dengan standar ID entitas metadata).

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Tabel (tables)

Field

Type

Deskripsi

datasource_type

string

Tipe sumber data, seperti dlf, starrocks, maxcompute, holodb, atau mysql.

datasource_id

string

Identifier sumber data, seperti ID kluster StarRocks, ID akun Alibaba Cloud DLF atau MaxCompute, atau ID instans RDS.

catalog_name

string

Nama katalog data. Diisi hanya jika tipe sumber data mendukung katalog.

database_name

string

Nama database.

schema_name

string

Nama skema. Diisi hanya jika tipe sumber data mendukung skema.

name

string

Nama tabel.

type

string

Tipe tabel.

comment

string

Komentar.

partition_keys

string

Kunci partisi. Untuk partisi multi-level, pisahkan field dengan koma.

location

string

Jalur penyimpanan tabel.

properties

string

Properti dan parameter (string JSON). Untuk view, field ini berisi DDL definisi view.

owner

string

Pemilik tabel. Bergantung pada tipe sumber data, nilai ini bisa berupa UID akun Alibaba Cloud atau akun sistem database.

content_size

bigint

Ukuran penyimpanan dalam byte.

data_retention

map<string,string>

Periode retensi data atau lifecycle. Nilai bervariasi berdasarkan tipe tabel: untuk tabel MaxCompute, kuncinya adalah lifecycle dan nilainya adalah lifecycle tabel (misalnya, 365); untuk tabel DLF, kuncinya adalah retention dan nilainya adalah lifecycle tabel (misalnya, 91); tipe lain belum didukung. Dokumentasi akan diperbarui jika dukungan ditambahkan.

is_compressed

boolean

Apakah tabel dikompresi.

is_temporary

boolean

Apakah tabel bersifat temporary.

entity_type

string

Tipe entitas, seperti table, view, atau materialized_view.

input_format

string

Format input.

output_format

string

Format output.

serde_parameters

string

Parameter SerDe.

serialization_lib

string

Pustaka serialisasi.

create_timestamp

bigint

Timestamp pembuatan tabel (13 digit).

meta_modified_timestamp

bigint

Timestamp modifikasi metadata tabel (13 digit).

data_modified_timestamp

bigint

Timestamp modifikasi data tabel (13 digit).

last_access_timestamp

bigint

Timestamp akses terakhir tabel (13 digit).

business_description

string

Deskripsi bisnis atau nama dalam bahasa Mandarin.

meta_entity_id

string

Identifier unik tabel (ramah API dan sesuai dengan standar ID entitas metadata).

Contoh:

  • maxcompute-table: ID akun Alibaba Cloud::nama_proyek:nama_skema:nama_tabel.

  • holo-table: ID instans Hologres::sample_database:schema publik:table_name.

  • starrocks-table: ID instans Kluster: default_catalog:sample_database::sample_table.

uuid

string

UUID tabel, digunakan untuk menautkan ke halaman detail tabel Peta Data DataWorks.

business_tags

array<string>

Tag bisnis. Tag yang diatur pada halaman Peta Data dicatat di field ini.

wikis

array<struct<`version`:bigint,`operator`:string,`update_timestamp`:bigint,`content`:string>>

Instruksi penggunaan tabel (version: nomor versi; operator: pengirim; update_timestamp: timestamp pembaruan (13 digit); content: konten).

producing_tasks

array<bigint>

Daftar ID tugas penjadwalan yang menghasilkan data tabel. Lihat tabel tasks.

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Kolom (columns)

Field

Type

Deskripsi

datasource_type

string

Tipe sumber data, seperti dlf atau starrocks.

datasource_id

string

Identifier sumber data, seperti ID kluster StarRocks, ID akun Alibaba Cloud DLF atau MaxCompute, atau ID instans RDS.

catalog_name

string

Nama katalog data. Diisi hanya jika tipe sumber data mendukung katalog.

database_name

string

Nama database.

schema_name

string

Nama skema. Diisi hanya jika tipe sumber data mendukung skema.

table_name

string

Nama tabel.

name

string

Nama kolom.

type

string

Tipe kolom.

comment

string

Komentar.

ordinal_position

bigint

Posisi ordinal kolom (dimulai dari 1).

is_primary_key

boolean

Apakah kolom merupakan kunci primer.

is_nullable

boolean

Apakah kolom mengizinkan nilai NULL.

is_partition_key

boolean

Apakah kolom merupakan kunci partisi.

properties

string

Properti dan parameter (string JSON).

business_description

string

Deskripsi bisnis.

meta_entity_id

string

Identifier unik kolom (ramah API dan sesuai dengan standar ID entitas metadata).

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Partisi (partitions)

Field

Type

Deskripsi

datasource_type

string

Tipe sumber data, seperti maxcompute, dlf, atau starrocks.

datasource_id

string

Identifier sumber data, seperti ID kluster StarRocks, ID akun Alibaba Cloud DLF atau MaxCompute, atau ID instans RDS.

catalog_name

string

Nama katalog data. Diisi hanya jika tipe sumber data mendukung katalog.

database_name

string

Nama database.

schema_name

string

Nama skema. Diisi hanya jika tipe sumber data mendukung skema.

table_name

string

Nama tabel.

name

string

Nama partisi (Spesifikasi Partisi).

create_timestamp

bigint

Timestamp pembuatan (13 digit).

update_timestamp

bigint

Timestamp modifikasi (13 digit).

content_size

bigint

Ukuran partisi dalam byte.

properties

string

Properti dan parameter (string JSON).

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Lineage Tingkat Tabel dan Kolom (lineages)

Field

Type

Deskripsi

source_meta_entity_id

string

Identifier unik sumber (ramah API dan sesuai dengan standar ID entitas metadata).

source_raw_entity_type

string

Tipe entitas sumber. Ketika metadata yang dirujuk tidak dikelola, source_meta_entity_type kosong dan source_raw_entity_type digunakan sebagai gantinya.

source_uuid

string

Identifier unik sumber (dapat diakses melalui halaman).

target_meta_entity_id

string

Identifier unik target (ramah API dan sesuai dengan standar ID entitas metadata).

target_raw_entity_type

string

Tipe entitas target. Ketika metadata yang dirujuk tidak dikelola, target_meta_entity_type kosong dan target_raw_entity_type digunakan sebagai gantinya.

target_uuid

string

Identifier unik target (dapat diakses melalui halaman).

compute_engine

string

Engine komputasi, seperti maxcompute, datax, atau hologres.

transform_type

string

Tipe tugas transformasi dalam engine, seperti SQL, DATAX, DATAX_STREAM, EXTERNAL_TABLE_MAPPING, STORAGE_MAPPING, atau API_MAPPING.

task_id

bigint

ID tugas penjadwalan DataWorks. Lihat tabel tasks. Field ini kosong untuk data lineage yang tidak dipicu oleh penjadwalan DataWorks.

task_instance_id

bigint

ID instans tugas penjadwalan DataWorks. Lihat tabel tasks_instances. Field ini kosong untuk data lineage yang tidak dipicu oleh penjadwalan DataWorks.

lineage_time

bigint

Waktu kejadian lineage (dalam milidetik).

granularity

string

Granularitas lineage, seperti TABLE atau COLUMN.

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Definisi Tugas/Alur Kerja (tasks)

Field

Type

Deskripsi

id

bigint

ID tugas.

name

string

Nama tugas.

description

string

Deskripsi tugas.

type

bigint

Tipe tugas. Untuk detailnya, lihat Pengembangan Node untuk nilai encoding node.

workflow_id

bigint

ID alur kerja.

instance_mode

string

Mode pembuatan instans.

  • T+1 (dibuat hari berikutnya)

  • Segera (dibuat segera)

baseline_id

bigint

ID garis dasar.

priority

bigint

Prioritas tugas, berkisar dari 1 (terendah) hingga 8 (tertinggi). Nilai yang lebih tinggi menunjukkan prioritas yang lebih tinggi. Prioritas default adalah 1.

timeout

bigint

Batas waktu eksekusi tugas dalam jam.

rerun_mode

bigint

Konfigurasi rerun tugas (0: rerun hanya diizinkan saat gagal; 1: rerun diizinkan saat sukses atau gagal; 2: tidak ada rerun yang diizinkan).

rerun_times

bigint

Jumlah percobaan ulang. Berlaku hanya ketika rerun diizinkan.

rerun_interval

bigint

Interval percobaan ulang dalam detik.

script_parameters

string

Daftar parameter skrip.

trigger_type

string

Tipe pemicu (Scheduler: pemicu penjadwalan periodik; Manual: pemicu manual).

trigger_recurrence

bigint

Mode eksekusi saat pemicu (0: eksekusi normal; 1: tugas manual; 2: dijeda; 3: dry-run; 4: tugas yang dirujuk).

trigger_cron

string

Ekspresi cron. Berlaku hanya ketika type=Scheduler.

trigger_start_time

string

Waktu mulai efektif untuk pemicu periodik. Berlaku hanya ketika type=Scheduler.

trigger_end_time

string

Waktu akhir efektif untuk pemicu periodik. Berlaku hanya ketika type=Scheduler.

runtime_resource_group_id

bigint

ID kelompok sumber daya untuk eksekusi tugas.

runtime_image

string

ID citra yang dikonfigurasi untuk eksekusi tugas.

runtime_cu

string

Konsumsi CU yang dikonfigurasi untuk eksekusi tugas.

datasource_name

string

Nama sumber data.

inputs_variables

array<struct<`name`:string,`type`:string,`value`:string>>

Daftar variabel input.

outputs

array<struct<`output`:string,`type`:string>>

Daftar identifier output tugas.

outputs_variables

array<struct<`name`:string,`type`:string,`value`:string>>

Daftar variabel output.

dependencies

array<struct<`type`:string,`upstream_output`:string,`upstream_node_id`:bigint>>

Daftar informasi dependensi.

related_workflow_id

bigint

ID alur kerja terkait.

tags

array<struct<`key`:string,`value`:string>>

Daftar tag tugas.

project_id

bigint

ID proyek. Lihat field workspace_id di tabel workspaces.

project_env

string

Tipe lingkungan (PROD: produksi; DEV: pengembangan).

owner

string

ID akun pemilik tugas. Lihat tabel users.

create_time

string

Waktu pembuatan.

modify_time

string

Waktu modifikasi.

create_user

string

ID akun pembuat. Lihat tabel users.

modify_user

string

Anda dapat mengubah ID akun pengguna di tabel users.

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Instans Eksekusi Tugas/Alur Kerja (task_instances)

Field

Type

Deskripsi

id

bigint

ID instans tugas.

node_id

bigint

ID tugas. Lihat tabel tasks.

node_type

bigint

Tipe tugas. Untuk detailnya, lihat Pengembangan Node untuk nilai encoding node.

node_name

string

Nama tugas.

description

string

Deskripsi tugas.

workflow_id

bigint

ID alur kerja. Lihat tabel tasks.

workflow_name

string

Nama alur kerja.

workflow_instance_id

bigint

ID instans alur kerja.

workflow_instance_type

bigint

Tipe instans alur kerja: (0-penjadwalan harian; 1-tugas manual; 2-pengujian asap; 3-pengisian ulang data; 4-alur kerja satu kali; 5-alur kerja manual).

trigger_type

string

Tipe pemicu (Scheduler/Manual).

trigger_recurrence

string

Mode eksekusi (0-normal; 1-manual; 2-dijeda; 3-dry-run; 4-dirujuk).

timeout

bigint

Batas waktu eksekusi tugas dalam jam.

rerun_mode

string

Konfigurasi rerun (0-rerun saat gagal; 1-rerun saat sukses atau gagal; 2-tidak ada rerun).

run_number

bigint

Jumlah eksekusi.

period_number

bigint

Nomor periode.

baseline_id

bigint

ID garis dasar.

priority

bigint

Prioritas tugas (1-8).

script_parameters

string

Daftar parameter skrip.

runtime_resource_group_id

bigint

ID kelompok sumber daya untuk eksekusi tugas.

runtime_resource_group_identifier

string

Nama identifier kelompok sumber daya untuk eksekusi tugas.

runtime_image

string

ID citra runtime.

runtime_cu

string

Konsumsi CU runtime.

runtime_process_id

string

ID proses runtime.

runtime_gateway

string

Gerbang runtime.

datasource_name

string

Nama sumber data.

inputs_variables

array<struct<`name`:string,`type`:string,`value`:string>>

Daftar variabel input.

outputs

array<struct<`output`:string,`type`:string>>

Daftar identifier output.

outputs_variables

array<struct<`name`:string,`type`:string,`value`:string>>

Daftar variabel output.

tags

array<struct<`key`:string,`value`:string>>

Daftar tag tugas.

status

bigint

Status tugas (1-belum dimulai; 2-menunggu waktu; 3-menunggu sumber daya; 4-berjalan; 5-gagal; 6-berhasil; 7-validasi; 8-pemeriksaan kondisi; 9-menunggu pemicu).

trigger_time

string

Waktu pemicu.

bizdate

string

Tanggal bisnis.

started_time

string

Waktu mulai.

finished_time

string

Waktu selesai.

project_id

bigint

ID proyek. Lihat field workspace_id di tabel workspaces.

project_env

string

Tipe lingkungan (PROD/DEV).

owner

string

ID akun pemilik. Lihat tabel users.

create_time

string

Waktu pembuatan.

modify_time

string

Waktu modifikasi.

create_user

string

ID akun pembuat. Lihat tabel users.

modify_user

string

ID akun pengubah. Lihat tabel users.

waiting_resource_time

string

Waktu yang dihabiskan menunggu sumber daya.

waiting_trigger_time

string

Waktu yang dihabiskan menunggu pemicu.

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Pengguna (users)

Field

Type

Deskripsi

user_id

string

Identifier pengguna.

user_nick

string

Alias akun (nama tampilan).

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Ruang Kerja (workspaces)

Field

Type

Deskripsi

workspace_id

bigint

ID ruang kerja.

workspace_name

string

Nama ruang kerja.

workspace_identifier

string

Identifier ruang kerja.

workspace_description

string

Deskripsi ruang kerja.

workspace_owner

string

Identifier pemilik ruang kerja. Lihat tabel users.

workspace_status

bigint

Status ruang kerja (0: normal; 1: dihapus; 2: inisialisasi; 3: inisialisasi gagal; 4: dinonaktifkan secara manual; 5: menghapus; 6: penghapusan gagal; 7: dibekukan karena Pembayaran tertunda).

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Anggota Ruang Kerja (workspace members)

Field

Type

Deskripsi

workspace_id

bigint

ID ruang kerja. Lihat tabel workspaces.

user_id

string

Identifier pengguna. Lihat tabel users.

user_status

bigint

Status pengguna (0: normal; 1: dinonaktifkan; 2: dihapus).

gmt_create_ts

bigint

Waktu pembuatan (timestamp 13 digit).

gmt_modified_ts

bigint

Waktu modifikasi (timestamp 13 digit).

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Kelompok Sumber Daya (resource groups)

Field

Type

Deskripsi

resource_group_id

bigint

ID kelompok sumber daya.

resource_group_identifier

string

Identifier kelompok sumber daya.

resource_group_type

bigint

Tipe kelompok sumber daya (1: kelompok sumber daya penjadwalan; 2: kelompok sumber daya MaxCompute; 4: kelompok sumber daya integrasi data).

resource_group_mode

bigint

Mode kelompok sumber daya (1: langganan; 2: bayar sesuai penggunaan; 3: edisi developer (khusus MaxCompute)).

resource_group_status

bigint

Status kelompok sumber daya (0: normal; 1: dibekukan; 2: dihapus; 3: membuat; 4: pembuatan gagal; 5: memperbarui; 6: pembaruan gagal; 7: menghapus; 8: penghapusan gagal).

is_exclusive_resource_group

boolean

Apakah kelompok sumber daya eksklusif.

dt

string

Partisi tanggal (field partisi logis), format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Metadata Contoh

Detail Metrik Tabel (table_metrics_detail)

Bidang

Tipe

Deskripsi

datasource_type

string

Tipe sumber data.

datasource_id

string

Identifier sumber data.

catalog_name

string

Nama katalog data.

database_name

string

Nama database.

schema_name

string

Nama skema data.

table_name

string

Nama tabel.

table_uuid

string

Identifier tabel, digunakan untuk navigasi ke detail.

meta_entity_id

string

Identifier tabel, mudah dibaca manusia.

content_size

bigint

Volume penyimpanan yang dikumpulkan. NULL jika pengumpulan volume penyimpanan tidak didukung.

daily_rate_cs

decimal(16,6)

Tingkat perubahan volume penyimpanan harian (hari ke hari).

avg_content_size_7d

bigint

Rata-rata volume penyimpanan 7 hari.

daily_rate_acs_7d

decimal(16,6)

Rata-rata harian tingkat perubahan volume penyimpanan 7 hari (hari ke hari).

latest_data_update_time_31d

bigint

Maximum data_modified_timestamp dalam 31 hari terakhir, atau waktu akhir instans hilir terbaru dalam lineage. NULL jika tidak ada pembaruan dalam 31 hari terakhir.

latest_data_update_task_id

bigint

ID tugas penjadwalan yang paling baru memperbarui tabel dalam 31 hari terakhir.

latest_data_update_instance_id

bigint

ID instans tugas penjadwalan yang paling baru memperbarui tabel dalam 31 hari terakhir.

latest_data_update_time_by_task

bigint

Waktu akhir instans tugas penjadwalan terbaru yang memperbarui tabel dalam 31 hari terakhir.

writing_task_ids

array<bigint>

ID tugas penjadwalan yang menulis ke tabel pada tanggal bisnis saat ini (tanpa duplikat).

writing_task_ids_31d

array<bigint>

ID tugas penjadwalan yang menulis ke tabel dalam 31 hari terakhir (tanpa duplikat).

latest_data_access_time_31d

bigint

Maximum last_access_timestamp dalam 31 hari terakhir, atau waktu akhir instans hulu terbaru dalam lineage. NULL jika tidak ada akses dalam 31 hari terakhir.

latest_data_access_task_id

bigint

ID tugas penjadwalan yang paling baru membaca tabel dalam 31 hari terakhir.

latest_data_access_instance_id

bigint

ID instans tugas penjadwalan yang paling baru membaca tabel dalam 31 hari terakhir.

latest_data_access_time_by_task

bigint

Waktu akhir instans hulu terbaru dalam lineage dalam 31 hari terakhir.

reading_task_ids

array<string>

ID tugas penjadwalan yang membaca tabel.

reading_task_ids_31d

array<string>

ID tugas penjadwalan yang membaca tabel dalam 31 hari terakhir (tanpa duplikat).

direct_downstream_tables

array<string>

ID tabel hilir langsung (UUID).

direct_upstream_tables

array<string>

ID tabel hulu langsung (UUID).

dt

string

Partisi tanggal, format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Rangkuman Metrik Tabel (table_metrics_summary)

Bidang

Tipe

Deskripsi

table_count

bigint

Jumlah tabel.

daily_rate_tc

decimal(16,6)

Tingkat perubahan jumlah tabel harian (hari ke hari).

avg_table_count_7d

bigint

Rata-rata jumlah tabel 7 hari.

daily_rate_atc_7d

decimal(16,6)

Rata-rata hariantingkat perubahan jumlah tabel 7 hari (hari ke hari).

content_size

bigint

Volume penyimpanan yang dikumpulkan. NULL jika pengumpulan volume penyimpanan tidak didukung.

daily_rate_cs

decimal(16,6)

Tingkat perubahan volume penyimpanan harian (hari ke hari).

avg_content_size_7d

bigint

Rata-rata volume penyimpanan 7 hari.

daily_rate_acs_7d

decimal(16,6)

Rata-rata harian tingkat perubahan volume penyimpanan 7 hari (hari ke hari).

updated_table_count

bigint

Jumlah tabel yang diperbarui dalam 31 hari terakhir.

daily_rate_utc

decimal(16,6)

Tingkat perubahan harian tabel yang diperbarui dalam 31 hari terakhir (hari ke hari).

avg_updated_table_count_7d

bigint

Rata-rata 7 hari jumlah tabel yang diperbarui dalam 31 hari terakhir.

daily_rate_autc_7d

decimal(16,6)

Rata-rata harian tingkat perubahan tabel yang diperbarui dalam 31 hari terakhir selama 7 hari (hari ke hari).

accessed_table_count

bigint

Jumlah tabel yang diakses dalam 31 hari terakhir.

daily_rate_atc

decimal(16,6)

Tingkat perubahan harian tabel yang diakses dalam 31 hari terakhir (hari ke hari).

avg_accessed_table_count_7d

bigint

Rata-rata 7 hari jumlah tabel yang diakses dalam 31 hari terakhir.

daily_rate_aatc_7d

decimal(16,6)

Rata-rata harian tingkat perubahan tabel yang diakses dalam 31 hari terakhir selama 7 hari (hari ke hari).

dt

string

Partisi tanggal, format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Detail Metrik Tugas (task_metrics_detail)

Bidang

Tipe

Deskripsi

task_id

bigint

Identifier tugas.

workflow_id

bigint

Identifier alur kerja.

node_type

bigint

Tipe tugas.

project_id

bigint

Identifier ruang kerja.

week_number

bigint

Nomor minggu dalam tahun untuk tanggal bisnis.

task_owner

string

ID pemilik.

compute_resource_type

string

Tipe sumber daya komputasi.

compute_resource_id

string

Identifier sumber daya komputasi, seperti nama proyek MaxCompute, ID kluster EMR, atau ID instans Hologres.

datasource_name

string

Nama sumber data.

inst_success_count

bigint

Jumlah instans yang berhasil.

inst_failed_count

bigint

Jumlah instans yang gagal.

inst_running_count

bigint

Jumlah instans yang sedang berjalan.

inst_abnormal_count

bigint

Jumlah instans abnormal.

inst_not_started_count

bigint

Jumlah instans yang belum dimulai.

inst_runtime_cu

double

Konsumsi CU runtime instans.

task_avg_cu_31d

double

Rata-rata harian konsumsi CU untuk tugas (dalam 31 hari).

dt

string

Partisi tanggal, format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].

Rangkuman Metrik Tugas (task_metrics_summary)

Bidang

Tipe

Deskripsi

node_type

bigint

Tipe node.

inst_status

string

Status instans.

inst_count

bigint

Jumlah instans.

avg_inst_count_7d

double

Rata-rata 7 hari jumlah instans.

granularity

string

Granularitas statistik: DAILY atau WEEKLY.

dt

string

Partisi tanggal, format YYYYMMDD, rentang: [TODAY-31D, TODAY-1D].