全部产品
Search
文档中心

DataWorks:Membuat dan menggunakan standar data

更新时间:Aug 16, 2025

DataWorks Data Modeling memungkinkan Anda mendefinisikan standar data sebelum atau selama proses pemodelan. Dengan menstandardisasi standar bidang, tabel lookup, satuan pengukuran, dan kamus penamaan, Anda dapat memastikan konsistensi dalam pemrosesan data untuk pemodelan dan pengembangan aplikasi di tahap selanjutnya. Pendekatan ini mendorong produksi data yang distandardisasi dari sumbernya, mengurangi biaya aplikasi dan pemrosesan data.

Standar data yang didukung

DataWorks mendukung standar data berikut: Field Standard, Lookup Table, Measurement Unit, dan Naming Dictionary.

Standar bidang

Standar bidang menormalisasi definisi suatu bidang, termasuk nama, tipe data, dan rentang nilainya. Menstandardisasi bidang dengan makna yang sama mencegah kebingungan akibat nama atau tipe yang tidak konsisten. Sebagai contoh, buat standar bidang bernama member_id dan terapkan pada tabel-tabel terkait untuk memastikan semua bidang ID anggota distandardisasi.

Nama Tabel

Bidang Asli

Deskripsi Masalah

Bidang Distandardisasi

Tabel Pendaftaran

user_id

Konvensi penamaan tidak konsisten

member_id

Tabel Login

userid

Tidak ada garis bawah

Tabel lookup

Tabel lookup mendefinisikan rentang nilai yang diizinkan untuk suatu bidang. Sebagai contoh, nilai-nilai untuk bidang gender mungkin dibatasi pada Male, Female, atau Unknown.

Satuan pengukuran

Definisikan satuan pengukuran yang digunakan dalam bisnis Anda. Sebagai contoh, satuan ukuran untuk item_quantity adalah pieces.

Kamus penamaan

Kamus penamaan menyediakan istilah standar dan terjemahan untuk istilah bisnis, tabel fisik, dan bidang. Ini berfungsi sebagai perpustakaan perusahaan untuk konvensi penamaan. Sebagai contoh, istilah standar untuk pendapatan tahunan perusahaan dapat didefinisikan sebagai Annual Gross Revenue.

Diagram hubungan standar data

Dalam konteks ini, asosiasi merujuk pada menghubungkan standar data ke bidang tertentu dalam model logis. Bidang tersebut harus mematuhi aturan standar.

Akses standar data

  1. Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi sisi kiri, pilih Data Development and O&M > Data Modeling. Pada halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down dan klik Go to Data Modeling.

  2. Pada halaman Data Modeling, klik Data Standard di bilah navigasi atas.

Standar data: Standar bidang

Standar bidang adalah definisi standar dari suatu bidang, yang menentukan penamaan, tipe data, dan rentang nilainya. Gunakan standar bidang untuk mengasosiasikan bidang-bidang yang memiliki makna sama tetapi nama berbeda di beberapa tabel. Jika standar bidang berubah nanti, Anda dapat dengan cepat menemukan dan memodifikasi tabel terkait.

Hirarki

  • Saat membuat standar bidang, Anda harus meletakkannya di direktori root, direktori, atau set standar.

    • Direktori Root: Direktori tingkat atas. Semua direktori, set standar, dan standar lainnya harus ditempatkan di bawah direktori root.

    • Direktori: Digunakan untuk menyimpan standar dan set standar, mirip dengan folder dalam sistem operasi.

    • Set Standar: Mirip dengan direktori, tetapi hanya dapat berisi standar.

  • Standar bidang dapat memiliki hubungan warisan. Sebagai contoh, standar ID pembeli dan ID penjual dapat mewarisi dari standar ID anggota.

Menetapkan standar bidang

Catatan

Jika Anda perlu memasukkan sejumlah besar standar bidang, Anda dapat menggunakan fitur impor massal.

  1. Pada halaman Data Standard, klik Field Standard di panel navigasi sisi kiri.

  2. Di pohon direktori di sebelah kiri, klik kanan direktori target atau set standar dan klik Create Standard.

  3. Konfigurasikan parameter utama di kotak dialog.

    Parameter

    Deskripsi

    Abbreviation

    Digunakan sebagai nama bidang terkait dalam model logis.

    Display Name

    Digunakan sebagai nama tampilan bidang terkait dalam model logis.

    Length

    Parameter terkait dengan tipe data. Sebagai contoh, untuk tipe DECIMAL, ini sesuai dengan 20 dalam DECIMAL(20, 4).

    Precision

    Parameter terkait dengan tipe data. Sebagai contoh, untuk tipe DECIMAL, ini sesuai dengan 4 dalam DECIMAL(20, 4).

    Not Empty

    Menentukan apakah bidang yang menggunakan standar ini boleh bernilai null. Nilai defaultnya adalah nullable.

    Default Value

    Nilai default untuk bidang jika tidak ada nilai yang diberikan. Panjang maksimum adalah 2048 karakter.

    Parent Standard

    Pilih standar yang ada sebagai induk untuk menetapkan hubungan warisan. Ini membantu Anda lebih baik mengidentifikasi hubungan bidang.

    Sebagai contoh, karena ID pembeli dan ID penjual adalah jenis ID anggota, standar induk untuk Standar ID Pembeli dan Standar ID Penjual akan menjadi Standar ID Anggota.

    Referenced Lookup Table

    Pilih tabel dari tabel lookup yang telah dibuat untuk membatasi rentang nilai bidang.

    Penting

    Hapus semua referensi sebelum menghapus standar bidang.

Menggunakan standar bidang

Gunakan standar bidang untuk mendefinisikan bidang spesifik dalam model logis, termasuk tabel sumber, tabel dimensi, tabel fakta, tabel agregat, dan tabel aplikasi. Sebagai contoh, Anda dapat mengasosiasikan bidang ID anggota dalam tabel dimensi informasi anggota dim_ecom_mbr_info_df dengan standar bidang member_id. Dalam hal ini, nama bidang berasal dari singkatan standar, nama tampilan berasal dari nama tampilan standar, dan properti Tipe dan Tidak Kosong juga diwarisi. Untuk informasi lebih lanjut lihat Atur informasi bidang tabel.

Standar data: Tabel lookup

Tabel lookup mendefinisikan rentang nilai yang diizinkan untuk suatu bidang.

Menetapkan tabel lookup

Catatan

Jika Anda perlu memasukkan sejumlah besar tabel lookup, Anda dapat menggunakan fitur impor massal.

  1. Pada halaman Data Standard, klik Lookup Table di panel navigasi sisi kiri.

  2. Klik kanan nama direktori dan klik Create Lookup Table.

  3. Di kotak dialog, konfigurasikan parameter dan tambahkan nilai enumerasi.

    Sebagai contoh, atur ID ke gender, Display Name ke gender, dan Name ke gender.

    ID Kode

    Nama Kode

    Nama

    Deskripsi

    0

    Tidak Diketahui

    unknown

    Jenis kelamin tidak ditentukan

    1

    Laki-laki

    male

    Laki-laki

    2

    Perempuan

    female

    Perempuan

    Penting

    Hapus semua referensi sebelum menghapus tabel lookup.

Publikasikan tabel lookup

Di halaman detail tabel lookup, klik Publikasikan di pojok kanan atas untuk mempublikasikan tabel lookup sebagai tabel fisik atau tampilan yang dimaterialisasi.

Menggunakan tabel lookup

Gunakan kode standar untuk mendefinisikan bidang spesifik dalam model logis, termasuk tabel sumber, tabel dimensi, dan tabel fakta. Sebagai contoh, Anda dapat mengasosiasikan bidang gender dalam tabel dimensi informasi anggota dim_ecom_mbr_info_df dengan bidang gender dalam tabel lookup. Dalam hal ini, nama bidang berasal dari ID tabel lookup, dan nama tampilan berasal dari Nama Tampilan tabel lookup. Untuk informasi lebih lanjut, lihat Konfigurasikan bidang tabel dimensi.

Jika suatu bidang memiliki nama berbeda di beberapa tabel, mengasosiasikan tabel lookup dapat secara otomatis memperbaiki dan menyatukan nama bidang.

Nama Tabel

Bidang Asli

Nilai Enumerasi Asli

Bidang Distandardisasi

Nilai Enumerasi Distandardisasi

Tabel Informasi Anggota

sex

1, 2

gender

0, 1, 2

Tabel Login Anggota

gender

0, 1, 2

Implementasikan standar berdasarkan tabel lookup

Saat tabel fakta atau tabel dimensi dalam model logis dipublikasikan ke tabel fisik, Anda dapat menghasilkan aturan kualitas untuk bidang spesifik yang diasosiasikan dengan kode standar. Lalu buat aturan pemantauan berdasarkan aturan kualitas ini untuk memantau dan menegakkan standar dalam tabel fisik. Untuk informasi lebih lanjut, lihat Hasilkan aturan pemantauan berdasarkan standar data.

Standar data: Satuan pengukuran

Definisikan satuan pengukuran yang relevan dengan bisnis Anda, seperti mata uang, kuantifier, dan satuan waktu.

Menetapkan satuan pengukuran

Catatan

Jika Anda perlu memasukkan sejumlah besar satuan pengukuran, Anda dapat menggunakan fitur impor massal.

  1. Pada halaman Data Standard, klik Measurement Unit di panel navigasi sisi kiri.

  2. Klik kanan nama direktori dan klik Create Measurement Unit.

  3. Di kotak dialog, konfigurasikan parameter dan klik OK.

    Sebagai contoh, atur Abbreviation ke m, Name ke meter, dan Display Name ke meter.

Menggunakan satuan pengukuran

Asosiasikan dengan model logis

Gunakan satuan ukuran untuk mendefinisikan satuan pengukuran untuk bidang spesifik dalam model logis, termasuk tabel fakta, tabel agregat, dan tabel aplikasi. Sebagai contoh, Anda dapat mengasosiasikan bidang item_quantity dalam tabel fakta pembuatan pesanan dwd_trade_order dengan satuan ukuran pieces. Untuk informasi lebih lanjut, lihat Atur informasi bidang tabel.

Asosiasikan dengan metrik atomik

Saat mendefinisikan metrik atomik, pilih satuan ukuran yang sesuai berdasarkan tipe data statistik dari metrik atomik.

Standar data: Kamus penamaan

Kamus penamaan menyediakan istilah standar dan terjemahan untuk istilah bisnis, tabel fisik, dan bidang. Ini berfungsi sebagai perpustakaan perusahaan untuk konvensi penamaan.

Menetapkan kamus penamaan

Catatan

Jika Anda perlu memasukkan sejumlah besar entri kamus penamaan, Anda dapat menggunakan fitur impor massal.

  1. Di halaman Data Standard, klik Naming Dictionary pada panel navigasi di sebelah kiri.

  2. Klik Create. Pada kotak dialog, atur parameter yang diperlukan, lalu klik OK.

    Sebagai contoh, atur Display Name ke Engine, Name ke engine, dan Abbreviation ke eng.

Menggunakan kamus penamaan

Gunakan kamus penamaan untuk memeriksa kepatuhan penamaan tabel di lapisan gudang data Anda, termasuk tabel sumber, tabel dimensi, tabel fakta, tabel agregat, dan tabel aplikasi. Sebagai contoh, jika entri kamus penamaan dengan singkatan trade tidak ada, tabel dwd_trade_order tidak akan sesuai dengan konvensi penamaan untuk lapisan data fakta DWD.

image

Untuk menggunakan fitur ini, konfigurasikan dalam pemeriksa di Data Warehouse Planning. Untuk informasi lebih lanjut, lihat Konfigurasikan pemeriksa lapisan gudang data dan Gunakan pemeriksa.

Operasi lainnya

Impor massal standar data

Jika Anda memiliki sejumlah besar standar data untuk dibuat, Anda dapat mengimpornya secara massal. DataWorks menyediakan template impor yang dapat Anda isi dan gunakan untuk impor massal.

  1. Pada halaman Data Standard, klik Naming Dictionary di panel navigasi sisi kiri.

    Tombol impor dan ekspor juga tersedia di halaman detail untuk standar bidang, tabel lookup, dan satuan pengukuran.
  2. Klik Import dan pilih Import Type.

  3. Di Template Preview, klik Download Template dan lengkapi bidang yang diperlukan.

  4. Klik Next step. Di tab Data Import, unggah dan pratinjau file data.

    Catatan
    • Import Mode: Jika objek dengan nama yang sama seperti dalam file impor sudah ada di DataWorks, Anda dapat melewati objek tersebut atau menimpanya dengan konten dari file impor.

    • Anda hanya dapat mengimpor file .xlsx secara massal. Hingga 30.000 catatan data dapat diimpor sekaligus, dan ukuran file tidak boleh melebihi 10 MB.

  5. Di halaman OK, lihat hasil impor. Klik View More Details untuk operasi lebih lanjut. Jika status impor adalah Failed, Anda harus menyelesaikan masalah berdasarkan log kesalahan dan mencoba mengimpor lagi.

Ekspor massal standar data

Gunakan fitur ekspor untuk menggunakan kembali standar data di berbagai ruang kerja. Tombol ekspor juga tersedia di halaman detail untuk Field Standard, Lookup Table, Measurement Unit, dan Naming Dictionary.