Seiring pertumbuhan bisnis, volumenya meningkat secara eksponensial, menghasilkan kumpulan data yang sangat besar dan kompleks dengan standar tidak konsisten, sehingga menimbulkan tantangan signifikan dalam manajemen data. Layanan Data Modeling Cerdas di DataWorks menyediakan pendekatan terstruktur untuk mengorganisasi data yang berantakan, kompleks, dan berskala besar, membantu Anda memaksimalkan nilai data perusahaan.
Prasyarat
Data Modeling Cerdas merupakan layanan bernilai tambah di DataWorks. Anda harus mengaktifkan layanan ini sebelum dapat menggunakan fitur-fiturnya. Untuk informasi lebih lanjut mengenai edisi yang tersedia dan standar penagihan, lihat Penagihan Data Modeling Cerdas.
Data Modeling hanya didukung di Chrome 69 atau versi lebih baru pada PC.
Batasan
Izin untuk menggunakan Data Modeling Cerdas bervariasi berdasarkan peran dalam Workspace DataWorks:
Lihat detail model: Semua peran dalam Workspace DataWorks, termasuk Visitor, Workspace Administrator, Model Designer, dan Project Owner, dapat melihat model data.
Edit informasi model: Hanya pengguna dengan peran Workspace Administrator, Development Personnel, O&M Personnel, atau Model Designer yang dapat mengedit model data.
Publikasikan model data: Hanya pengguna dengan peran Workspace Administrator atau O&M Personnel yang dapat mempublikasikan model data.
Untuk melakukan tindakan tersebut, berikan peran yang sesuai kepada pengguna target. Untuk informasi lebih lanjut tentang cara memberikan izin, lihat Kelola Izin pada Modul dalam Workspace.
Ikhtisar
DataWorks Data Modeling mendukung Perencanaan Gudang Data, penetapan Standar Data, Pemodelan Dimensi, dan pendefinisian Metrik Data. Dengan menggunakan Data Modeling di DataWorks, Anda dapat merealisasikan Tabel Dimensi, Tabel Fakta, dan Tabel Agregat dari desain Anda ke dalam compute engine untuk aplikasi lebih lanjut.

Data Warehouse Planning
Saat menggunakan DataWorks untuk Data Modeling, Anda dapat merancang Lapisan Data, Kategori Bisnis, Domain Data, Area Subjek, dan Proses Bisnis pada halaman Perencanaan Gudang Data.
Data Layer
Anda dapat merancang Lapisan Data gudang data Anda berdasarkan skenario bisnis dan data Anda. DataWorks menyediakan arsitektur lima lapisan default yang umum digunakan di industri:
Operational Data Store (ODS)
Data Warehouse Detail (DWD)
Data Warehouse Summary (DWS)
Application Data Service (ADS)
Dimension (DIM)
Anda juga dapat membuat Lapisan Data lainnya sesuai kebutuhan bisnis Anda. Untuk petunjuk cara membuat Lapisan Data kustom, lihat Buat Lapisan Data Kustom.
Business Category
Jika bisnis Anda kompleks dan berbagai jenis bisnis memerlukan cara cepat untuk menemukan datanya sendiri, Anda dapat menentukan Kategori Bisnis yang berbeda. Anda kemudian dapat mengaitkan kategori-kategori ini dengan Tabel Dimensi dan Tabel Fakta yang sesuai selama pemodelan. Untuk petunjuk cara membuat Kategori Bisnis, lihat Kategori Bisnis.
Data Domain
Domain Data adalah standar klasifikasi data tingkat tinggi. Domain ini merupakan kumpulan proses bisnis yang telah diabstraksi dan disempurnakan, membantu pengguna bisnis menemukan data relevan secara cepat dari kumpulan data yang sangat besar.
Domain Data dirancang untuk analisis bisnis. Setiap Domain Data mewakili area analitis makro, seperti pengadaan, rantai pasok, SDM, atau e-commerce. Tim terpadu atau individu, seperti arsitek data atau anggota tim pemodelan, harus mengelola dan mendefinisikan Domain Data. Perancang ini harus memiliki pemahaman mendalam tentang bisnis agar dapat menginterpretasikan dan mengabstraksi proses bisnis secara tepat. Untuk petunjuk cara merencanakan dan membangun Domain Data di DataWorks, lihat Domain Data.
Business Process
Proses Bisnis menggambarkan alur aktivitas bisnis. Misalnya, dalam e-commerce, menambahkan item ke keranjang, melakukan pemesanan, dan melakukan pembayaran masing-masing dapat menjadi Proses Bisnis. Kasus penggunaan umum adalah analisis corong (funnel analysis), di mana perjalanan pembelian dipecah menjadi langkah-langkah seperti menelusuri item, menambahkan ke keranjang, memesan, membayar, dan mengonfirmasi penerimaan. Dengan melacak jumlah pesanan pada setiap tahap, Anda dapat menganalisis metrik "jumlah pesanan" sepanjang corong tersebut. Untuk petunjuk cara membuat Proses Bisnis di DataWorks, lihat Proses Bisnis.
Data Mart
Data Mart mendefinisikan tema bisnis terperinci untuk Kategori Bisnis tertentu. Data Mart menggunakan Area Subjek untuk mempartisi data dari berbagai perspektif analitis, pada akhirnya melayani aplikasi bisnis dan analisis statistik. Contohnya adalah Data Mart untuk platform operasional. Untuk informasi lebih lanjut, lihat Data Mart.
Area Subjek
Area Subjek digunakan untuk membagi Data Mart berdasarkan perspektif analitis yang berbeda. Area ini merupakan kumpulan tema data yang saling terkait erat. Anda dapat mengelompokkan tema-tema tersebut ke dalam Area Subjek yang berbeda berdasarkan fokus bisnis. Misalnya, Area Subjek umum dalam e-commerce mencakup transaksi, anggota, dan produk. Untuk informasi lebih lanjut, lihat Area Subjek.
Data Standard
DataWorks Data Modeling memungkinkan Anda menetapkan Standar Data sebelum mulai memodelkan atau mengembangkannya dari praktik bisnis seiring waktu. Dengan menstandarisasi Lookup Tables, Satuan Pengukuran, Standar Bidang, dan Kamus Penamaan, Anda memastikan konsistensi dalam pemrosesan data selama pemodelan dan aplikasi.
Sebagai contoh, pertimbangkan dua tabel: tabel pendaftaran dan tabel Logon. Tabel pendaftaran berisi ID anggota yang disimpan dalam bidang bernama user_id, sedangkan tabel Logon menyimpan informasi yang sama dalam bidang bernama userid. Untuk mengatasi hal ini, Anda dapat membuat Standar Bidang terpadu untuk ID anggota. Standar ini dapat menentukan Lookup Table untuk pemrosesan data, mendefinisikan properti bidang (seperti tipe data, panjang, dan nilai default), serta menetapkan Satuan Pengukuran. Setelah Standar Bidang ini dibuat, Anda dapat mengaitkannya dengan bidang ID anggota di semua model mendatang, memastikan konsistensi di seluruh tabel.
Untuk petunjuk cara membuat Standar Bidang di DataWorks, lihat Standar Bidang.
Dimensional Modeling
Filosofi Data Modeling di DataWorks mengikuti prinsip Pemodelan Dimensi. Saat merancang gudang data menggunakan fitur Pemodelan Dimensi:
Dimension Table
Berdasarkan rencana Domain Data bisnis Anda, Anda dapat mengekstraksi dimensi potensial untuk analisis data dan menyimpannya beserta atributnya dalam Tabel Dimensi. Misalnya, dalam analisis data e-commerce, dimensi dan atribut yang berguna meliputi: dimensi pesanan (dengan atribut seperti ID pesanan, waktu pembuatan, ID pembeli, dan ID penjual), dimensi pengguna (jenis kelamin, tanggal lahir), dan dimensi produk (ID produk, nama, waktu peluncuran). Anda dapat membuat Tabel Dimensi untuk pesanan, pengguna, dan produk, di mana atribut dimensi disimpan sebagai bidang dalam tabel tersebut. Anda kemudian dapat men-deploy tabel-tabel ini ke gudang data Anda dan menggunakan pekerjaan ETL untuk menyimpan data dimensi aktual sesuai definisi tabel, sehingga siap digunakan oleh analis bisnis.
Fact Table
Mengikuti rencana Proses Bisnis Anda, Anda dapat mengidentifikasi dan mengorganisasi data faktual yang dihasilkan selama setiap proses dan menyimpan bidang-bidang tersebut dalam Tabel Fakta. Misalnya, untuk Proses Bisnis "melakukan pemesanan", Anda dapat membuat Tabel Fakta yang sesuai untuk mencatat data yang dihasilkan selama proses tersebut, seperti ID pesanan, waktu pembuatan, ID produk, kuantitas, dan jumlah. Anda kemudian dapat men-deploy Tabel Fakta ini ke gudang data Anda dan menggunakan pekerjaan ETL untuk mengonsolidasi dan menyimpan data nyata sesuai definisi tabel, sehingga dapat diakses untuk analisis bisnis.
Aggregate Table
Anda dapat melakukan agregasi awal data fakta dan dimensi terperinci ke dalam Tabel Agregat berdasarkan kebutuhan analisis bisnis dan lapisan gudang data. Untuk analisis data selanjutnya, Anda dapat langsung melakukan kueri terhadap Tabel Agregat, bukan Tabel Fakta dan Dimensi yang lebih granular.
Application Table
Tabel Aplikasi dirancang untuk skenario bisnis tertentu guna mengorganisasi beberapa Metrik Atom dan Metrik Turunan yang memiliki Periode dan dimensi yang sama. Tabel ini berfungsi sebagai fondasi untuk kueri bisnis, analisis OLAP, dan distribusi data. Anda dapat merancang Tabel Aplikasi berdasarkan kebutuhan aplikasi bisnis Anda.
Reverse Modeling
Pemodelan Terbalik terutama digunakan untuk mengimpor model yang dihasilkan oleh alat lain ke dalam modul Pemodelan Dimensi DataWorks. Misalnya, jika Anda memiliki model yang sudah ada dan ingin beralih ke pemodelan cerdas DataWorks, Anda dapat menggunakan fitur Pemodelan Terbalik. Fitur ini secara cepat mengimpor model yang sudah ada, menghemat waktu dan upaya signifikan untuk memodel ulang.
Untuk petunjuk cara membuat Tabel Dimensi, Tabel Fakta, dan Tabel Agregat, lihat Buat model logis: Tabel Dimensi, Buat model logis: Tabel Fakta, Buat model logis: Tabel Agregat, dan Buat model logis: Tabel Aplikasi. Untuk informasi lebih lanjut tentang Pemodelan Terbalik, lihat Pemodelan Terbalik: Balikkan Tabel Fisik.
Data Metrics
Data Modeling di DataWorks menyediakan fitur Metrik Data yang memungkinkan Anda membangun sistem metrik terpadu.
Sistem metrik terdiri dari Atomic Metric, Modifier, Period, dan Derived Metric.
Atomic Metric: Ukuran berdasarkan Proses Bisnis, seperti "jumlah pembayaran" dalam proses "melakukan pembayaran".
Modifier: Kualifikasi yang membatasi cakupan metrik, seperti membatasi statistik "jumlah pembayaran" hanya untuk "produk ibu dan anak".
Period: Rentang waktu atau titik waktu untuk metrik, seperti menentukan "jumlah pembayaran" dihitung selama "7 hari terakhir".
Derived Metric: Kombinasi Metrik Atom, Modifier, dan Periode. Contohnya, "total jumlah pembayaran untuk produk ibu dan anak selama 7 hari terakhir".
Untuk petunjuk cara membuat sistem metrik, lihat Metrik Data.
Mengapa pemodelan data penting
Manajemen Terstandarisasi untuk Volume Data Besar
Semakin besar bisnis, semakin kompleks struktur datanya. Seiring pertumbuhan bisnis, volumenya meningkat pesat. Mengelola dan menyimpan data ini secara terstruktur dan teratur merupakan tantangan bagi setiap perusahaan.
Hancurkan Silo Data dan Aktifkan Konektivitas
Ketika data dikelola secara independen oleh unit bisnis dan departemen yang berbeda, terbentuklah silo data. Hal ini mencegah pengambil keputusan mendapatkan gambaran menyeluruh dan cepat mengenai data perusahaan. Menghancurkan silo data ini merupakan tantangan utama dalam manajemen data perusahaan.
Standar Data Terpadu untuk Integrasi Fleksibel
Deskripsi berbeda untuk data yang sama menyebabkan kesulitan manajemen, duplikasi konten, dan hasil yang tidak akurat. Menetapkan Standar Data terpadu tanpa mengganggu arsitektur sistem yang ada merupakan kunci untuk memungkinkan integrasi fleksibel dengan layanan hulu dan hilir.
Maksimalkan Nilai Data dan Keuntungan Bisnis
Data Modeling yang efektif memungkinkan Anda memanfaatkan data perusahaan secara penuh, memaksimalkan nilainya, dan menyediakan layanan data yang lebih efisien bagi bisnis Anda.