Fitur pemodelan data di DataWorks mengikuti metodologi Pemodelan Dimensi Kimball, memungkinkan Anda merancang dan membuat Dimension Tables, Fact Tables, Aggregate Tables, dan Application Tables sesuai kebutuhan bisnis. Model-model tersebut kemudian dapat dipublikasikan ke R&D Engine yang sesuai. Selain itu, Anda juga dapat menggunakan Reverse Modeling untuk menghasilkan model dari Physical Tables yang telah ada.
Pemodelan data digunakan untuk perencanaan dan perancangan gudang data. Anda dapat menggunakan model untuk membuat Physical Tables secara cepat di sumber daya komputasi yang sesuai. Penghapusan model tidak memengaruhi Physical Table yang mendasarinya.
Perspektif pemodelan
Pemodelan dimensi memungkinkan Anda mengklasifikasikan tabel model yang dibuat ke dalam Data Import Layer, Common Layer, dan Application Layer. Anda dapat memilih lapisan yang sesuai berdasarkan kebutuhan aktual. Setiap lapisan menyediakan perspektif manajemen yang berbeda.
Common Layer: Memproses dan mengintegrasikan data umum dari Data Import Layer, menetapkan metrik dan dimensi terpadu, serta membangun data fakta detail dan ringkasan yang dapat digunakan kembali untuk analisis dan statistik. Lapisan ini mendukung pengelolaan tabel model dari perspektif Data Domain atau Business Category.
Application Layer: Mengonsumsi data yang telah diproses dari Common Layer untuk menghasilkan statistik khusus bagi skenario aplikasi atau Produk tertentu. Lapisan ini hanya mendukung pengelolaan tabel model dari perspektif Business Category.
Unlayered: Jika tabel model tidak ditetapkan ke Common Layer atau Application Layer, DataWorks akan menempatkannya di Unlayered.
Setelah memilih suatu lapisan, Anda hanya dapat membuat tabel target di dalam lapisan tersebut. Anda juga dapat beralih antar perspektif manajemen yang didukung oleh lapisan tersebut melalui pohon direktori untuk melihat dan mengelola tabel model.
Dimensions
Dimension adalah sudut pandang untuk mengukur dan mengamati aktivitas bisnis. Dalam Pemodelan Dimensi, Dimension menentukan konteks tempat proses bisnis terjadi, sehingga membantu Anda memahami data dari berbagai sudut pandang. Sebagai contoh, dalam skenario e-commerce, dimensi dapat mencakup produk, wilayah, dan waktu.
Untuk informasi lebih lanjut tentang cara merancang dan membuat Dimension, lihat Buat model konseptual: Dimension.
Dimension tables
Ekstrak semua dimensi yang mungkin ada di setiap data domain, lalu simpan dimensi beserta atribut-atributnya dalam dimension tables. Sebagai contoh, saat menganalisis data bisnis e-commerce, dimensi yang mungkin (beserta atribut masing-masing) meliputi pesanan (ID pesanan, waktu pembuatan pesanan, ID pembeli, dan ID penjual), pengguna (jenis kelamin dan tanggal lahir), serta komoditas (ID komoditas, nama komoditas, dan waktu komoditas dipajang). Anda dapat membuat dimension tables berikut: order dimension table, user dimension table, dan commodity dimension table. Atribut setiap dimensi digunakan sebagai bidang dalam dimension table. Anda dapat men-deploy dimension tables tersebut di gudang data dan melakukan operasi ekstrak, transformasi, dan muat (ETL) untuk menyimpan data dimensi dalam format yang ditentukan di dimension table, sehingga memungkinkan staf bisnis mengakses data tersebut untuk analisis selanjutnya.
Untuk informasi lebih lanjut tentang cara merancang dan membuat Dimension Table, lihat Buat model logis: Dimension table.
Fact tables
Urutkan dan analisis data yang dihasilkan dalam setiap proses bisnis, lalu simpan data tersebut dalam fact tables sebagai bidang. Sebagai contoh, Anda dapat membuat fact table untuk proses bisnis pemesanan dan mencatat informasi berikut sebagai bidang dalam fact table: ID pesanan, waktu pembuatan pesanan, ID komoditas, jumlah komoditas, dan jumlah penjualan. Anda dapat men-deploy fact tables tersebut di gudang data dan melakukan operasi ETL untuk meringkas dan menyimpan data dalam format yang ditentukan di fact table, sehingga memungkinkan staf bisnis mengakses data tersebut untuk analisis selanjutnya.
Untuk informasi lebih lanjut tentang cara merancang dan membuat Fact Table, lihat Buat model logis: Fact table.
Aggregate tables
Aggregate table mengorganisasi data statistik untuk beberapa derived metrics dalam satu data domain yang memiliki periode waktu dan dimensi yang sama. Tabel ini merupakan hasil abstraksi bisnis tingkat tinggi dan menyediakan fondasi untuk kueri bisnis, analisis OLAP, serta distribusi data selanjutnya. Untuk informasi lebih lanjut tentang cara merancang dan membuat aggregate tables, lihat Buat model logis: aggregate table.
Application tables
Application Table dirancang untuk skenario bisnis tertentu dan digunakan untuk mengorganisasi data statistik dari beberapa atomic metrics, derived metrics, atau granularitas statistik yang memiliki periode waktu dan dimensi yang sama. Tabel ini menyediakan fondasi untuk aktivitas selanjutnya seperti kueri bisnis, analisis OLAP, dan distribusi data. Anda dapat merancang application tables sesuai kebutuhan bisnis Anda. Untuk informasi lebih lanjut tentang cara merancang dan membuat application tables, lihat Buat model logis: Application table.
Reverse modeling
Reverse Modeling adalah proses menghasilkan model logis dari Physical Table. Fitur ini menghemat banyak waktu karena Anda dapat membuat model dengan cepat tanpa harus mengulangi proses pemodelan. Untuk informasi lebih lanjut, lihat Reverse Modeling: Reverse-Modeling a Physical Table.