Seiring pertumbuhan pesat bisnis, volume datanya meningkat secara eksponensial. Data tersebut sering kali berukuran besar, kompleks, dan tidak memiliki standar yang konsisten, sehingga sulit dikelola. Layanan pemodelan data cerdas dari DataWorks menyediakan pendekatan terstruktur dan terorganisir untuk mengelola data besar, kompleks, dan tidak terstruktur ini, membantu perusahaan menghasilkan lebih banyak nilai dari datanya serta memaksimalkan potensinya.
Prasyarat
Layanan pemodelan data cerdas dari DataWorks merupakan layanan bernilai tambah. Anda harus mengaktifkannya terlebih dahulu sebelum dapat menggunakan fitur-fiturnya. Untuk informasi lebih lanjut mengenai spesifikasi dan penagihan, lihat Penagihan pemodelan data cerdas.
Anda hanya dapat menggunakan pemodelan data pada PC dengan Chrome 69 atau versi yang lebih baru.
Batasan
Izin penggunaan pemodelan data cerdas bervariasi berdasarkan peran dalam ruang kerja DataWorks:
Semua peran dalam ruang kerja DataWorks dapat melihat detail model data, termasuk Visitor, Workspace Administrator, Model Designer, dan Project Owner.
Hanya pengguna dengan peran Workspace Administrator, Developer, O&M, atau Model Designer yang dapat mengedit informasi model.
Hanya pengguna dengan peran Workspace Administrator atau O&M yang dapat menerbitkan model data.
Untuk melakukan operasi tersebut, berikan izin peran yang sesuai kepada pengguna. Untuk informasi selengkapnya, lihat Mengelola izin pada layanan tingkat ruang kerja.
Ikhtisar
Pemodelan data DataWorks mendukung Perencanaan Gudang Data, pembuatan dan akumulasi standar data perusahaan, Pemodelan dimensional, serta definisi Metrik Data. Anda dapat menggunakan pemodelan data untuk mewujudkan tabel dimensi, tabel fakta, dan tabel agregat yang dibuat selama proses pemodelan ke dalam Mesin komputasi guna penggunaan lebih lanjut.

Data Warehouse Planning
Saat menggunakan DataWorks untuk pemodelan data, Anda dapat merancang lapisan data, kategori bisnis, Bidang subjek, dan proses bisnis di halaman Perencanaan Gudang Data.
Data Layer
Anda dapat merancang lapisan data gudang data berdasarkan skenario dan karakteristik data bisnis Anda. Secara default, DataWorks menyediakan lima lapisan gudang data umum berikut:
Operational Data Store (ODS)
Data Warehouse Detail (DWD)
Data Warehouse Summary (DWS)
Application Data Service (ADS)
Dimension (DIM)
Anda juga dapat membuat lapisan data tambahan sesuai kebutuhan. Untuk informasi selengkapnya, lihat Lapisan kustom.
Business Category
Jika bisnis Anda kompleks dan berbagai jenis bisnis perlu berbagi domain data, Anda dapat merencanakan kategori bisnis untuk mempermudah pencarian data spesifik selama desain dan penerapan model. Kategori tersebut kemudian dapat dikaitkan dengan tabel dimensi dan tabel fakta yang sesuai. Untuk informasi selengkapnya, lihat Kategori bisnis.
Data Domain
Domain data adalah standar tingkat tinggi untuk klasifikasi data, yang merepresentasikan kumpulan proses bisnis yang telah diabstraksi, disempurnakan, dan digabungkan. Domain data membantu staf bisnis mengidentifikasi data relevan mereka secara cepat dari volume data yang besar.
Domain data digunakan dalam analisis bisnis. Satu domain data berkorespondensi dengan area analisis makro, seperti pengadaan, rantai pasok, SDM, atau E-dagang. Disarankan agar domain data dikelola dan ditetapkan oleh organisasi atau personel terpadu, seperti arsitek data atau anggota tim pemodelan. Perancang domain data harus memiliki pemahaman mendalam tentang bisnis perusahaan serta mampu mengekspresikan interpretasi dan abstraksi bisnis tersebut. Untuk informasi selengkapnya, lihat Domain data.
Business Process
Proses bisnis menggambarkan alur aktivitas bisnis. Misalnya, dalam E-dagang, menambahkan item ke keranjang belanja, membuat Pesanan, dan melakukan pembayaran masing-masing merupakan proses bisnis. Proses bisnis biasanya digunakan dalam analisis kinerja bisnis. Sebagai contoh, dalam analisis corong umum, aktivitas membeli produk dipecah menjadi proses bisnis seperti menelusuri produk, menambahkan ke keranjang belanja, membuat Pesanan, membayar, dan mengonfirmasi penerimaan. Anda kemudian dapat menghitung jumlah Pesanan pada setiap tahap proses bisnis dan melakukan analisis corong berdasarkan metrik tersebut. Untuk informasi selengkapnya, lihat Proses bisnis.
Data mart
Data mart mendefinisikan subjek bisnis terperinci untuk suatu kategori bisnis. Data mart menggunakan Bidang subjek untuk mempartisi data dalam mart target berdasarkan perspektif analisis yang berbeda. Data akhir digunakan untuk analisis statistik dalam aplikasi bisnis, misalnya data mart platform O&M. Untuk informasi selengkapnya, lihat Data mart.
Bidang subjek
Bidang subjek mempartisi data mart berdasarkan perspektif analisis. Bidang subjek biasanya merupakan kumpulan subjek data yang saling terkait erat. Anda dapat membagi subjek data tersebut ke dalam Bidang subjek yang berbeda sesuai fokus bisnis Anda. Misalnya, industri E-dagang sering dibagi menjadi domain transaksi, anggota, dan Produk. Untuk informasi selengkapnya, lihat Bidang subjek.
Data Standard
Pemodelan data DataWorks mendukung perencanaan dan pembuatan standar data sebelum pemodelan, serta memungkinkan akumulasi standar data perusahaan berdasarkan kondisi bisnis selama proses pemodelan. Dengan menstandarkan batasan untuk tabel lookup, Satuan pengukuran, standar bidang, dan kamus penamaan, Anda dapat memastikan konsistensi dalam Pemrosesan data selama pemodelan dan penerapan selanjutnya.
Sebagai contoh, pertimbangkan tabel pendaftaran dan tabel logon. Tabel pendaftaran menyimpan ID anggota dalam bidang bernama user_id, sedangkan tabel logon menyimpan ID anggota dalam bidang bernama userid. Dalam kasus ini, Anda dapat membuat standar bidang terpadu untuk ID anggota dengan menentukan tabel lookup untuk Pemrosesan data, mendefinisikan properti bidang seperti Tipe data, panjang, dan nilai default, serta menentukan Satuan pengukuran untuk data tersebut. Setelah standar bidang dibuat, Anda dapat langsung mengaitkannya dengan bidang ID anggota apa pun selama pemodelan, sehingga memastikan konsistensi di seluruh sistem.
Untuk informasi selengkapnya, lihat Standar bidang.
Dimensional Modeling
Konsep pemodelan data di DataWorks mengikuti prinsip Pemodelan dimensional. Saat menggunakan fitur Pemodelan dimensional DataWorks untuk merancang model gudang data:
Dimension Table
Berdasarkan rencana domain data bisnis Anda, Anda dapat mengekstrak dimensi yang mungkin digunakan untuk analisis data di setiap domain dan menyimpan dimensi tersebut beserta propertinya dalam tabel dimensi. Misalnya, saat menganalisis data bisnis E-dagang, dimensi yang tersedia beserta propertinya mencakup dimensi Pesanan (ID Pesanan, waktu pembuatan Pesanan, ID pembeli, ID penjual), dimensi pengguna (jenis kelamin, tanggal lahir), dan dimensi Produk (ID Produk, nama Produk, waktu daftar Produk). Anda dapat membuat tabel dimensi untuk Pesanan, pengguna, dan Produk, serta menggunakan properti dimensi sebagai bidang dalam tabel tersebut. Tabel dimensi ini kemudian dapat diterapkan ke gudang data, dan data dimensi aktual dapat disimpan sesuai definisi tabel melalui proses ekstrak, transformasi, dan muat (ETL), sehingga memudahkan staf bisnis mengakses data untuk analisis di masa mendatang.
Fact Table
Berdasarkan rencana proses bisnis, Anda dapat mengidentifikasi dan menganalisis data aktual yang dihasilkan dalam setiap proses bisnis, lalu menyimpan bidang data tersebut dalam tabel fakta. Misalnya, untuk proses bisnis pembuatan Pesanan, Anda dapat membuat tabel fakta pembuatan Pesanan yang mencatat bidang data seperti ID Pesanan, waktu pembuatan Pesanan, ID Produk, kuantitas, dan jumlah. Tabel fakta ini kemudian dapat diterapkan ke gudang data, dan data nyata dapat dirangkum serta disimpan sesuai definisi tabel melalui proses ETL, sehingga memudahkan staf bisnis mengakses data untuk analisis.
Aggregate Table
Berdasarkan analisis data bisnis dan struktur lapisan gudang data, Anda dapat meringkas data fakta terperinci dan data dimensi untuk membuat tabel agregat. Untuk analisis data selanjutnya, Anda dapat langsung menggunakan data dalam tabel agregat tanpa perlu mengakses data dari tabel fakta dan tabel dimensi.
Tabel Aplikasi
Tabel aplikasi digunakan untuk skenario bisnis tertentu. Tabel ini mengorganisasi data statistik dari beberapa metrik atom, metrik turunan, atau granularitas statistik yang memiliki periode dan dimensi yang sama, sehingga memberikan fondasi untuk kueri bisnis, analisis pemrosesan analitik daring (OLAP), dan distribusi data. Anda dapat merancang tabel aplikasi sesuai kebutuhan dan skenario penerapan Anda.
Reverse Modeling
Pemodelan terbalik terutama digunakan untuk merekayasa balik model yang dihasilkan oleh alat pemodelan lain ke dalam modul Pemodelan dimensional DataWorks. Misalnya, jika Anda telah membuat model menggunakan alat lain dan ingin beralih ke pemodelan cerdas DataWorks untuk pekerjaan selanjutnya, Anda dapat menggunakan fitur Pemodelan terbalik. Fitur ini memungkinkan Anda menerapkan model yang sudah ada ke dalam Pemodelan dimensional DataWorks secara cepat tanpa harus mengulang proses pemodelan, sehingga menghemat banyak waktu.
Untuk informasi selengkapnya, lihat Buat model logis: Tabel dimensi, Buat model logis: Tabel fakta, Buat model logis: Tabel agregat, dan Buat model logis: Tabel aplikasi. Untuk informasi selengkapnya mengenai Pemodelan terbalik, lihat Lakukan Pemodelan terbalik pada tabel fisik.
Data Metric
Fitur pemodelan data DataWorks menyediakan fungsi Metrik Data yang menawarkan cara terpadu untuk membangun sistem metrik.
Sistem metrik terdiri dari Atomic Metrics, Modifiers, Periods, dan Derived Metrics.
Atomic Metric: Ukuran dalam suatu proses bisnis, seperti "jumlah pembayaran" dalam proses bisnis "membayar Pesanan".
Modifier: Kualifikasi yang mempersempit cakupan metrik, seperti membatasi "jumlah pembayaran" hanya untuk "produk ibu dan anak".
Period: Rentang waktu atau titik waktu penghitungan metrik. Misalnya, periode untuk metrik "jumlah pembayaran" dapat diatur menjadi "7 hari terakhir".
Derived Metric: Kombinasi dari metrik atom, pengubah, dan periode. Misalnya, jumlah pembayaran untuk produk ibu dan anak dalam 7 hari terakhir.
Untuk informasi selengkapnya, lihat Metrik Data.
Mengapa pemodelan data diperlukan
Manajemen terstandarisasi atas data masif
Semakin besar bisnis suatu perusahaan, semakin kompleks struktur datanya. Volume data meningkat pesat seiring perkembangan bisnis. Mengelola dan menyimpan data secara terstruktur dan terorganisir merupakan tantangan yang dihadapi setiap perusahaan.
Interkoneksi data bisnis untuk menghilangkan hambatan informasi
Silo data terbentuk ketika data dari berbagai bisnis dan departemen dalam perusahaan dikelola secara independen. Hal ini menghambat pengambil keputusan dalam memperoleh gambaran menyeluruh yang jelas dan cepat mengenai data perusahaan. Menghilangkan silo informasi antardepartemen atau antardomain bisnis merupakan tantangan utama dalam manajemen data perusahaan.
Integrasi standar data untuk koneksi terpadu dan fleksibel
Deskripsi berbeda untuk data yang sama menyulitkan manajemen data perusahaan dan dapat menyebabkan duplikasi serta hasil yang tidak akurat. Bagian penting dari manajemen terstandarisasi adalah menciptakan standar data terpadu yang dapat terhubung secara fleksibel ke bisnis hulu dan hilir tanpa mengganggu arsitektur sistem yang ada.
Maksimalisasi nilai data dan keuntungan perusahaan
Manfaatkan secara optimal semua jenis data perusahaan untuk memaksimalkan nilainya serta menyediakan layanan data yang lebih efisien bagi perusahaan.