Dimensi merupakan fondasi pemodelan dimensional. Dalam pendekatan ini, ukuran (measure) dikenal sebagai fakta (fact), sedangkan konteks yang menjelaskan fakta tersebut disebut dimensi. Tabel Dimensi berisi informasi detail mengenai atribut-atribut yang dirujuk oleh Tabel Fakta, seperti tanggal atau kota. Topik ini menjelaskan cara membuat Tabel Dimensi.
Ikhtisar
Ekstrak semua dimensi yang mungkin ada di setiap domain data, lalu simpan dimensi beserta atribut-atributnya dalam tabel dimensi. Misalnya, saat menganalisis data bisnis e-commerce, dimensi yang mungkin mencakup pesanan (ID pesanan, waktu pembuatan pesanan, ID pembeli, dan ID penjual), pengguna (jenis kelamin dan tanggal lahir), serta komoditas (ID komoditas, nama komoditas, dan waktu komoditas dipajang). Anda dapat membuat tabel dimensi berikut: tabel dimensi pesanan, tabel dimensi pengguna, dan tabel dimensi komoditas. Atribut setiap dimensi digunakan sebagai bidang (field) dalam tabel dimensi tersebut. Tabel dimensi dapat dideploy ke dalam gudang data, lalu melalui operasi ekstrak, transformasi, dan muat (ETL), data dimensi disimpan sesuai format yang ditentukan dalam tabel dimensi. Hal ini memungkinkan staf bisnis mengakses data tersebut untuk analisis lebih lanjut.
Diagram di atas menggambarkan konsep-konsep berikut:
Saat membuat Tabel Dimensi:
Anda dapat menentukan lapisan gudang data tempat menyimpan data Tabel Dimensi. Biasanya, Tabel Dimensi disimpan di Lapisan Umum (DIM), tetapi juga dapat disimpan di Lapisan Aplikasi. Secara default, Lapisan Aplikasi hanya mengizinkan pembuatan tabel aplikasi. Untuk membuat Tabel Dimensi di Lapisan Aplikasi, Anda harus membuat lapisan aplikasi baru dan mengatur tipe modelnya menjadi Dimension atau Dimension Table, Dimension. Untuk informasi selengkapnya, lihat Definisikan lapisan gudang data.
Bergantung pada lapisan gudang data yang dipilih, Anda dapat mengaitkan Tabel Dimensi dengan Domain Data tertentu di bawah Kategori Bisnis, atau dengan Data Mart dan Area Subjek. Hal ini menyederhanakan manajemen dengan mengorganisasi tabel dari perspektif domain data atau data mart.
Setelah membuat Tabel Dimensi, Anda dapat menambahkan dimensi sebagai atribut ke dalam tabel, mengonfigurasi asosiasi dan partisi, serta menggunakan Field Standard atau Lookup Table yang konsisten untuk definisi bidang. Hal ini memastikan bahwa atribut data dimensi konsisten di seluruh Domain Data.
Setelah mengonfigurasi Tabel Dimensi:
Anda dapat mematerialisasikannya ke mesin penyimpanan untuk analisis data di mesin komputasi.
Saat merancang metrik turunan dan tabel ringkasan, Anda dapat langsung mereferensikan dan menggunakan bidang dari Tabel Dimensi.
Prasyarat
Lapisan Umum memproses dan mengintegrasikan data bersama untuk membangun Tabel Dimensi terpadu yang berlaku di seluruh perusahaan. Lapisan Aplikasi menggunakan data dari Lapisan Umum untuk membangun Tabel Dimensi spesifik bisnis berdasarkan kebutuhan aplikasi, mendukung pengembangan data kustom. Anda dapat membuat Tabel Dimensi baik di Lapisan Umum maupun Lapisan Aplikasi.
Lapisan data | Prasyarat | Referensi |
Common Layer | Anda telah membuat lapisan gudang data di Common Layer. Hal ini menentukan lapisan tempat Tabel Dimensi akan ditempatkan. | |
Anda telah membuat Data Domain. Hal ini menentukan perspektif data bisnis untuk Tabel Dimensi. | ||
Application Layer | Anda telah membuat lapisan gudang data di Application Layer. Hal ini menentukan lapisan tempat Tabel Dimensi akan ditempatkan. | |
Anda telah membuat Data Mart. Hal ini menentukan kategori data yang dilayani Tabel Dimensi untuk aplikasi atau produk tertentu. |
Buat Tabel Dimensi
Buka halaman Pemodelan Data.
Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi kiri, pilih . Pada halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down, lalu klik Go to Data Modeling.
Di halaman Data Modeling, klik Dimensional Modeling untuk membuka halaman Dimensional Modeling.
Buat Tabel Dimensi.
Di halaman Dimensional Modeling, arahkan kursor ke ikon
lalu pilih .Konfigurasikan informasi dasar untuk Tabel Dimensi.
Anda dapat memilih lapisan, Data Domain, Kategori Bisnis, dan Data Mart untuk Tabel Dimensi sesuai kebutuhan. Setelah memilih opsi tersebut, Anda dapat melihat Tabel Dimensi yang dibuat di daftar objek yang sesuai. Topik ini menggunakan contoh Tabel Dimensi di Common Layer.
Tabel berikut menjelaskan parameter utama.Parameter
Deskripsi
Data Layer
Pilih lapisan gudang data untuk Tabel Dimensi. Lapisan berbeda melayani skenario bisnis berbeda:
Common Layer: Memproses dan mengintegrasikan data bersama untuk membuat Tabel Dimensi terpadu yang berlaku di seluruh perusahaan. Jika memilih lapisan ini, Anda juga harus menentukan Data Domain. Untuk informasi selengkapnya tentang cara membuat Data Domain, lihat Data Domain.
Application Layer: Membangun Tabel Dimensi spesifik bisnis untuk aplikasi tertentu. Jika memilih lapisan ini, Anda juga harus menentukan Data Mart. Untuk informasi selengkapnya tentang cara membuat Data Mart, lihat Data Mart.
CatatanSecara default, Application Layer hanya mengizinkan pembuatan tabel aplikasi. Untuk membuat Tabel Dimensi di Application Layer, Anda harus membuat lapisan aplikasi baru dan mengatur tipe modelnya menjadi Dimension atau Dimension Table, Dimension. Untuk informasi selengkapnya, lihat Definisikan lapisan gudang data.
Business Category
Jika Anda memilih Common Layer untuk Data layer category, Anda dapat memilih Kategori Bisnis untuk Tabel Dimensi.
Data Domain
Jika Anda memilih Common Layer untuk Data layer category, Anda dapat memilih Data Domain untuk Tabel Dimensi.
Category/Mart/Subject
Jika Anda memilih Application Layer untuk Data layer category, Anda harus memilih Data Mart atau Area Subjek di bawah Kategori Bisnis.
Storage Policy
Kebijakan yang menentukan periode retensi dan volume data untuk Tabel Dimensi.
Dimension
Dimensi yang dikaitkan dengan Tabel Dimensi. Ini digunakan untuk menentukan perspektif analisis data.
CatatanUntuk informasi selengkapnya tentang cara membuat dimensi, lihat Model konseptual: Dimensi.
Naming Rule
Pemeriksa (checker) yang menegakkan konvensi penamaan. Jika Anda memilih checker, Table Name tabel harus mematuhi aturannya.
CatatanUntuk informasi selengkapnya tentang cara mengonfigurasi checker, lihat Konfigurasikan checker lapisan gudang data.
Table Name
Nama Tabel Dimensi. Jika Anda telah mengonfigurasi aturan penamaan, nama tabel harus mengikuti aturan tersebut.
Table Display Name
Nama tampilan Tabel Dimensi.
Lifecycle
Periode retensi untuk Tabel Dimensi. Periode retensi maksimum adalah 36.000 hari.
Owner
Orang yang bertanggung jawab atas Tabel Dimensi. Secara default, ini adalah pengguna yang membuat tabel.
Description
Deskripsi Tabel Dimensi.
Setelah mengonfigurasi parameter, klik Save untuk membuat Tabel Dimensi.
Anda dapat menemukan dan mengelola Tabel Dimensi tersebut di bawah Data Domain atau Kategori Bisnis yang sesuai dalam pohon navigasi kiri halaman Dimensional Modeling.
Tambahkan bidang ke tabel
Setelah membuat model, tambahkan bidang ke dalamnya.
Anda dapat menambahkan bidang ke tabel dalam Shortcut Mode atau Script Mode. Dalam Shortcut Mode, Anda dapat menggunakan fitur Import from Table/View untuk mengimpor bidang dari tabel fisik atau view yang sudah ada di mesin komputasi. Pilih tabel atau view dari daftar drop-down Search For Existing Table/View untuk mengimpor bidangnya.
Shortcut mode
Bidang hanya dapat diimpor dari tabel atau view di mesin MaxCompute, Hologres, dan E-MapReduce (EMR) Hive.


Dalam Shortcut Mode, klik Expand di samping Import from Table/View.
Di kotak pencarian Search For Existing Table/View, masukkan nama untuk mencari dan memilih tabel atau view yang dituju. Setelah tabel direferensikan, Anda dapat memilih untuk mengimpor semua bidang atau bidang tertentu dari tabel atau view tersebut.
CatatanPencarian fuzzy didukung. Anda dapat memasukkan kata kunci untuk mencari semua tabel atau view yang namanya mengandung kata kunci tersebut.
Anda hanya dapat mencari tabel di lingkungan produksi. Tabel di lingkungan pengembangan tidak didukung.
Ikon
menunjukkan bahwa semua bidang diimpor.Ikon
menunjukkan bahwa bidang tertentu diimpor.
Jika Anda memilih untuk mengimpor bidang tertentu, sebuah dialog akan muncul menampilkan bidang-bidang dari tabel yang dipilih. Pilih bidang yang ingin ditambahkan ke model, lalu klik Import di bagian bawah dialog.
Jika ada bidang yang diimpor memiliki Field Display Name kosong, Anda dapat mengikuti petunjuk di layar untuk mengisi nama tampilan dengan deskripsi bidang tersebut.
Script mode
Anda juga dapat menggunakan pernyataan FML untuk membuat bidang, asosiasi, dan partisi. Untuk informasi selengkapnya, lihat Pemodelan Script Mode.
Code Mode memungkinkan Anda membuat Tabel Dimensi dengan menulis kode. Setelah mengisi informasi dasar Tabel Dimensi dan menyimpannya, klik Script Mode. Sebuah dialog akan muncul berisi bahasa pemodelan yang dihasilkan secara otomatis berdasarkan informasi model yang telah dikonfigurasi. Anda dapat memodifikasi informasi model di sini, lalu klik OK.
Konfigurasikan informasi bidang
Setelah menambahkan bidang ke model, Anda dapat mengonfigurasi Associated Field, Redundant Field, dan Associated Granularity/Metric untuk setiap bidang.
Atur atribut bidang.
Secara default, atribut bidang yang ditampilkan meliputi Field Name, Type, Field Display Name, Description, Primary Key, Not Null, Measurement Unit, dan Actions. Di pojok kanan atas daftar bidang, klik Field Display Settings untuk memilih atribut mana yang ditampilkan dan mengubahnya sesuai kebutuhan.
Kaitkan bidang dengan Field Standard to Associate dan Lookup Table to Associate. Hal ini memungkinkan Anda mengaitkan bidang yang ditambahkan dengan Field Standard dan Lookup Table untuk menstandarkan konten dan rentang nilai bidang.
Alternatifnya, setelah mengonfigurasi bidang, Anda dapat mengklik tombol asosiasi di pojok kanan atas daftar bidang untuk mengatur Atomic Metric, Lookup Table, dan Field Standard untuk semua bidang sekaligus.
Field Standard to Associate: Menstandarkan dan mengelola data yang memiliki makna sama tetapi nama bidang berbeda. Ini mendefinisikan rentang nilai, satuan ukuran, dan properti lain dari suatu bidang.
Lookup Table to Associate: Mendefinisikan konten dan rentang data yang dapat dipilih untuk Field Standard tertentu.
Atur Redundant Field.
Dalam skema bintang tradisional untuk pemodelan dimensional, dimensi disimpan dalam Tabel Dimensi dan diakses melalui kunci asing di Tabel Fakta. Desain ini membantu mengurangi konsumsi penyimpanan. Sebaliknya, model dimensional di DataWorks Intelligent Data Modeling sering menggunakan bidang redundan untuk atribut yang sering diakses, seperti ID pengguna atau dimensi analisis umum. Praktik ini, yang merupakan bentuk denormalisasi, meningkatkan performa kueri downstream, menyederhanakan pengambilan data, dan mengurangi kebutuhan penggabungan tabel.
Contoh 1: Tabel `order_creation_details` dapat menyertakan atribut dimensi redundan dari tabel `shipping_address_dimension`, seperti `shipping_address` dan `recipient_phone_number`.
Contoh 2: Tabel `product_dimension` dapat menyertakan atribut redundan dari tabel `product_information`, seperti `procurement_information` dan `brand_information`.
Di kolom Actions untuk suatu bidang, klik Redundant Field untuk mengonfigurasi bidang terkaitnya.

Setelah menyelesaikan konfigurasi, klik Save di pojok kiri atas.
Langkah selanjutnya
Setelah membuat Tabel Dimensi, Anda juga harus mengonfigurasi manajemen bidang, asosiasi, dan pengaturan partisi. Anda juga harus memublikasikan tabel ke lingkungan yang sesuai. Untuk informasi selengkapnya, lihat topik-topik berikut: