DataWorks Data Modeling memungkinkan Anda mendefinisikan standar data sebelum atau selama proses pemodelan. Dengan menstandardisasi standar bidang, tabel lookup, satuan pengukuran, dan kamus penamaan, Anda dapat memastikan konsistensi dalam pemrosesan data untuk pemodelan dan pengembangan aplikasi di tahap selanjutnya. Pendekatan ini mendorong produksi data yang distandardisasi dari sumbernya, mengurangi biaya aplikasi dan pemrosesan data.
Standar data yang didukung
DataWorks mendukung standar data berikut: Field Standard, Lookup Table, Measurement Unit, dan Naming Dictionary.
Standar bidang
Standar bidang menormalisasi definisi suatu bidang, termasuk nama, tipe data, dan rentang nilainya. Menstandardisasi bidang dengan makna yang sama mencegah kebingungan akibat nama atau tipe yang tidak konsisten. Sebagai contoh, buat standar bidang bernama member_id dan terapkan pada tabel-tabel terkait untuk memastikan semua bidang ID anggota distandardisasi.
Nama Tabel | Bidang Asli | Deskripsi Masalah | Bidang Distandardisasi |
Tabel Pendaftaran | user_id | Konvensi penamaan tidak konsisten | member_id |
Tabel Login | userid | Tidak ada garis bawah |
Tabel lookup
Tabel lookup mendefinisikan rentang nilai yang diizinkan untuk suatu bidang. Sebagai contoh, nilai-nilai untuk bidang gender mungkin dibatasi pada Male, Female, atau Unknown.
Satuan pengukuran
Definisikan satuan pengukuran yang digunakan dalam bisnis Anda. Sebagai contoh, satuan ukuran untuk item_quantity adalah pieces.
Kamus penamaan
Kamus penamaan menyediakan istilah standar dan terjemahan untuk istilah bisnis, tabel fisik, dan bidang. Ini berfungsi sebagai perpustakaan perusahaan untuk konvensi penamaan. Sebagai contoh, istilah standar untuk pendapatan tahunan perusahaan dapat didefinisikan sebagai Annual Gross Revenue.
Diagram hubungan standar data
Dalam konteks ini, asosiasi merujuk pada menghubungkan standar data ke bidang tertentu dalam model logis. Bidang tersebut harus mematuhi aturan standar.
Akses standar data
Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi sisi kiri, pilih . Pada halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down dan klik Go to Data Modeling.
Pada halaman Data Modeling, klik Data Standard di bilah navigasi atas.
Standar data: Standar bidang
Standar bidang adalah definisi standar dari suatu bidang, yang menentukan penamaan, tipe data, dan rentang nilainya. Gunakan standar bidang untuk mengasosiasikan bidang-bidang yang memiliki makna sama tetapi nama berbeda di beberapa tabel. Jika standar bidang berubah nanti, Anda dapat dengan cepat menemukan dan memodifikasi tabel terkait.
Hirarki
Saat membuat standar bidang, Anda harus meletakkannya di direktori root, direktori, atau set standar.
Direktori Root: Direktori tingkat atas. Semua direktori, set standar, dan standar lainnya harus ditempatkan di bawah direktori root.
Direktori: Digunakan untuk menyimpan standar dan set standar, mirip dengan folder dalam sistem operasi.
Set Standar: Mirip dengan direktori, tetapi hanya dapat berisi standar.
Standar bidang dapat memiliki hubungan warisan. Sebagai contoh, standar ID pembeli dan ID penjual dapat mewarisi dari standar ID anggota.
Menetapkan standar bidang
Jika Anda perlu memasukkan sejumlah besar standar bidang, Anda dapat menggunakan fitur impor massal.
Pada halaman Data Standard, klik Field Standard di panel navigasi sisi kiri.
Di pohon direktori di sebelah kiri, klik kanan direktori target atau set standar dan klik Create Standard.
Konfigurasikan parameter utama di kotak dialog.
Parameter
Deskripsi
Abbreviation
Digunakan sebagai nama bidang terkait dalam model logis.
Display Name
Digunakan sebagai nama tampilan bidang terkait dalam model logis.
Length
Parameter terkait dengan tipe data. Sebagai contoh, untuk tipe DECIMAL, ini sesuai dengan 20 dalam DECIMAL(20, 4).
Precision
Parameter terkait dengan tipe data. Sebagai contoh, untuk tipe DECIMAL, ini sesuai dengan 4 dalam DECIMAL(20, 4).
Not Empty
Menentukan apakah bidang yang menggunakan standar ini boleh bernilai null. Nilai defaultnya adalah nullable.
Default Value
Nilai default untuk bidang jika tidak ada nilai yang diberikan. Panjang maksimum adalah 2048 karakter.
Parent Standard
Pilih standar yang ada sebagai induk untuk menetapkan hubungan warisan. Ini membantu Anda lebih baik mengidentifikasi hubungan bidang.
Sebagai contoh, karena ID pembeli dan ID penjual adalah jenis ID anggota, standar induk untuk Standar ID Pembeli dan Standar ID Penjual akan menjadi Standar ID Anggota.
Referenced Lookup Table
Pilih tabel dari tabel lookup yang telah dibuat untuk membatasi rentang nilai bidang.
PentingHapus semua referensi sebelum menghapus standar bidang.
Menggunakan standar bidang
Gunakan standar bidang untuk mendefinisikan bidang spesifik dalam model logis, termasuk tabel sumber, tabel dimensi, tabel fakta, tabel agregat, dan tabel aplikasi. Sebagai contoh, Anda dapat mengasosiasikan bidang ID anggota dalam tabel dimensi informasi anggota dim_ecom_mbr_info_df dengan standar bidang member_id. Dalam hal ini, nama bidang berasal dari singkatan standar, nama tampilan berasal dari nama tampilan standar, dan properti Tipe dan Tidak Kosong juga diwarisi. Untuk informasi lebih lanjut lihat Atur informasi bidang tabel.
Standar data: Tabel lookup
Tabel lookup mendefinisikan rentang nilai yang diizinkan untuk suatu bidang.
Menetapkan tabel lookup
Jika Anda perlu memasukkan sejumlah besar tabel lookup, Anda dapat menggunakan fitur impor massal.
Pada halaman Data Standard, klik Lookup Table di panel navigasi sisi kiri.
Klik kanan nama direktori dan klik Create Lookup Table.
Di kotak dialog, konfigurasikan parameter dan tambahkan nilai enumerasi.
Sebagai contoh, atur ID ke gender, Display Name ke gender, dan Name ke gender.
ID Kode
Nama Kode
Nama
Deskripsi
0
Tidak Diketahui
unknown
Jenis kelamin tidak ditentukan
1
Laki-laki
male
Laki-laki
2
Perempuan
female
Perempuan
PentingHapus semua referensi sebelum menghapus tabel lookup.
Publikasikan tabel lookup
Di halaman detail tabel lookup, klik Publikasikan di pojok kanan atas untuk mempublikasikan tabel lookup sebagai tabel fisik atau tampilan yang dimaterialisasi.
Menggunakan tabel lookup
Gunakan kode standar untuk mendefinisikan bidang spesifik dalam model logis, termasuk tabel sumber, tabel dimensi, dan tabel fakta. Sebagai contoh, Anda dapat mengasosiasikan bidang gender dalam tabel dimensi informasi anggota dim_ecom_mbr_info_df dengan bidang gender dalam tabel lookup. Dalam hal ini, nama bidang berasal dari ID tabel lookup, dan nama tampilan berasal dari Nama Tampilan tabel lookup. Untuk informasi lebih lanjut, lihat Konfigurasikan bidang tabel dimensi.
Jika suatu bidang memiliki nama berbeda di beberapa tabel, mengasosiasikan tabel lookup dapat secara otomatis memperbaiki dan menyatukan nama bidang.
Nama Tabel | Bidang Asli | Nilai Enumerasi Asli | Bidang Distandardisasi | Nilai Enumerasi Distandardisasi |
Tabel Informasi Anggota | sex | 1, 2 | gender | 0, 1, 2 |
Tabel Login Anggota | gender | 0, 1, 2 |
Implementasikan standar berdasarkan tabel lookup
Saat tabel fakta atau tabel dimensi dalam model logis dipublikasikan ke tabel fisik, Anda dapat menghasilkan aturan kualitas untuk bidang spesifik yang diasosiasikan dengan kode standar. Lalu buat aturan pemantauan berdasarkan aturan kualitas ini untuk memantau dan menegakkan standar dalam tabel fisik. Untuk informasi lebih lanjut, lihat Hasilkan aturan pemantauan berdasarkan standar data.
Standar data: Satuan pengukuran
Definisikan satuan pengukuran yang relevan dengan bisnis Anda, seperti mata uang, kuantifier, dan satuan waktu.
Menetapkan satuan pengukuran
Jika Anda perlu memasukkan sejumlah besar satuan pengukuran, Anda dapat menggunakan fitur impor massal.
Pada halaman Data Standard, klik Measurement Unit di panel navigasi sisi kiri.
Klik kanan nama direktori dan klik Create Measurement Unit.
Di kotak dialog, konfigurasikan parameter dan klik OK.
Sebagai contoh, atur Abbreviation ke m, Name ke meter, dan Display Name ke meter.
Menggunakan satuan pengukuran
Asosiasikan dengan model logis
Gunakan satuan ukuran untuk mendefinisikan satuan pengukuran untuk bidang spesifik dalam model logis, termasuk tabel fakta, tabel agregat, dan tabel aplikasi. Sebagai contoh, Anda dapat mengasosiasikan bidang item_quantity dalam tabel fakta pembuatan pesanan dwd_trade_order dengan satuan ukuran pieces. Untuk informasi lebih lanjut, lihat Atur informasi bidang tabel.
Asosiasikan dengan metrik atomik
Saat mendefinisikan metrik atomik, pilih satuan ukuran yang sesuai berdasarkan tipe data statistik dari metrik atomik.
Standar data: Kamus penamaan
Kamus penamaan menyediakan istilah standar dan terjemahan untuk istilah bisnis, tabel fisik, dan bidang. Ini berfungsi sebagai perpustakaan perusahaan untuk konvensi penamaan.
Menetapkan kamus penamaan
Jika Anda perlu memasukkan sejumlah besar entri kamus penamaan, Anda dapat menggunakan fitur impor massal.
Di halaman Data Standard, klik Naming Dictionary pada panel navigasi di sebelah kiri.
Klik Create. Pada kotak dialog, atur parameter yang diperlukan, lalu klik OK.
Sebagai contoh, atur Display Name ke Engine, Name ke engine, dan Abbreviation ke eng.
Menggunakan kamus penamaan
Gunakan kamus penamaan untuk memeriksa kepatuhan penamaan tabel di lapisan gudang data Anda, termasuk tabel sumber, tabel dimensi, tabel fakta, tabel agregat, dan tabel aplikasi. Sebagai contoh, jika entri kamus penamaan dengan singkatan trade tidak ada, tabel dwd_trade_order tidak akan sesuai dengan konvensi penamaan untuk lapisan data fakta DWD.

Untuk menggunakan fitur ini, konfigurasikan dalam pemeriksa di Data Warehouse Planning. Untuk informasi lebih lanjut, lihat Konfigurasikan pemeriksa lapisan gudang data dan Gunakan pemeriksa.
Operasi lainnya
Impor massal standar data
Jika Anda memiliki sejumlah besar standar data untuk dibuat, Anda dapat mengimpornya secara massal. DataWorks menyediakan template impor yang dapat Anda isi dan gunakan untuk impor massal.
Pada halaman Data Standard, klik Naming Dictionary di panel navigasi sisi kiri.
Tombol impor dan ekspor juga tersedia di halaman detail untuk standar bidang, tabel lookup, dan satuan pengukuran.
Klik Import dan pilih Import Type.
Di Template Preview, klik Download Template dan lengkapi bidang yang diperlukan.
Klik Next step. Di tab Data Import, unggah dan pratinjau file data.
CatatanImport Mode: Jika objek dengan nama yang sama seperti dalam file impor sudah ada di DataWorks, Anda dapat melewati objek tersebut atau menimpanya dengan konten dari file impor.
Anda hanya dapat mengimpor file
.xlsxsecara massal. Hingga 30.000 catatan data dapat diimpor sekaligus, dan ukuran file tidak boleh melebihi10 MB.
Di halaman OK, lihat hasil impor. Klik View More Details untuk operasi lebih lanjut. Jika status impor adalah Failed, Anda harus menyelesaikan masalah berdasarkan log kesalahan dan mencoba mengimpor lagi.
Ekspor massal standar data
Gunakan fitur ekspor untuk menggunakan kembali standar data di berbagai ruang kerja. Tombol ekspor juga tersedia di halaman detail untuk Field Standard, Lookup Table, Measurement Unit, dan Naming Dictionary.