全部产品
Search
文档中心

DataWorks:Ikhtisar pemodelan data

更新时间:Dec 02, 2025

Seiring pertumbuhan bisnis, volume datanya meningkat secara eksponensial. Data tersebut sering kali berukuran besar, kompleks, dan tidak konsisten, sehingga sulit dikelola. Layanan pemodelan data cerdas di DataWorks menyusun dan mengorganisasi data yang kompleks dan tidak terstruktur ini, membantu Anda memaksimalkan nilai data perusahaan.

Prasyarat

Fitur pemodelan data cerdas DataWorks merupakan layanan bernilai tambah. Anda harus mengaktifkan layanan tersebut untuk menggunakan fitur-fiturnya. Untuk informasi lebih lanjut mengenai spesifikasi dan standar penagihan yang berlaku, lihat Penagihan pemodelan data cerdas.

Catatan

Pemodelan data hanya didukung pada versi desktop Chrome 69 atau yang lebih baru.

Batasan

Batasan berikut berlaku bagi peran yang berbeda saat menggunakan pemodelan data cerdas di ruang kerja DataWorks:

  • Semua peran dalam ruang kerja DataWorks—seperti Visitor, Workspace Admin, Model Designer, dan Project Owner—dapat melihat detail model data.

  • Hanya pengguna dengan peran Workspace Admin, Developer, O&M, atau Model Designer yang dapat mengedit informasi model.

  • Penerbitan model data hanya dapat dilakukan oleh pengguna dengan peran Workspace Admin atau O&M.

Untuk melakukan operasi tersebut, Anda harus memberikan izin peran yang sesuai kepada pengguna target. Untuk informasi selengkapnya tentang cara memberikan izin, lihat Kelola izin pada modul di ruang kerja.

Ikhtisar

Pemodelan data DataWorks mendukung perencanaan gudang data, pembuatan standar data, pemodelan dimensional, dan definisi metrik data. Anda dapat menggunakan pemodelan data DataWorks untuk merealisasikan tabel dimensi, tabel detail, dan tabel agregat dari desain model Anda ke mesin komputasi guna penggunaan lebih lanjut.

架构图

  • Data Warehouse Planning

    Saat menggunakan DataWorks untuk pemodelan data, Anda dapat merancang lapisan data, kategori bisnis, domain data, dan proses bisnis di halaman Perencanaan Gudang Data.

    • Data Layering

      Anda dapat merancang lapisan data untuk gudang data Anda berdasarkan skenario bisnis dan karakteristik data. Secara default, DataWorks menyediakan gudang data lima lapis standar:

      • Operational data store (ODS)

      • Data warehouse detail (DWD)

      • Data warehouse summary (DWS)

      • Application data service (ADS)

      • Dimension (DIM)

      Anda juga dapat membuat lapisan data tambahan sesuai kebutuhan. Untuk informasi selengkapnya tentang cara membuat lapisan data, lihat Kustomisasi lapisan data.

    • Business Category

      Jika perusahaan Anda memiliki operasi kompleks yang melibatkan berbagai jenis bisnis yang berbagi domain data, Anda mungkin perlu menemukan data untuk bisnis tertentu secara cepat selama desain model. Untuk itu, Anda dapat menentukan kategori bisnis sesuai kebutuhan, lalu mengaitkan tabel dimensi dan tabel detail dengan kategori bisnis yang relevan selama pemodelan. Untuk informasi selengkapnya tentang cara membuat kategori bisnis, lihat Kategori bisnis.

    • Data Domain

      Domain data adalah standar klasifikasi data tingkat tinggi yang merepresentasikan kumpulan proses bisnis yang telah diabstraksi, disempurnakan, dan digabungkan. Domain data membantu staf bisnis menemukan data relevan secara cepat dari volume data yang sangat besar.

      Domain data digunakan untuk analisis bisnis. Setiap domain data berkorespondensi dengan area analisis luas, seperti pembelian, rantai pasok, SDM, atau E-dagang. Domain data harus dikelola dan didefinisikan oleh organisasi pusat atau personel tertentu, seperti arsitek data atau anggota tim model. Perancang domain data harus memiliki pemahaman mendalam tentang bisnis agar dapat menginterpretasikan dan mengabstraksi proses bisnis secara tepat. Untuk informasi selengkapnya tentang cara merencanakan dan membangun domain data menggunakan DataWorks, lihat Data domain.

    • Business Process

      Proses bisnis menggambarkan alur aktivitas bisnis. Misalnya, dalam E-dagang, menambahkan item ke keranjang belanja, melakukan pemesanan, dan melakukan pembayaran semuanya merupakan proses bisnis. Proses bisnis umumnya digunakan dalam analisis kinerja bisnis. Sebagai contoh, dalam analisis corong (funnel analysis) tipikal, aktivitas pembelian produk dipecah menjadi proses bisnis seperti menelusuri produk, menambahkan ke keranjang belanja, melakukan pemesanan, melakukan pembayaran, dan mengonfirmasi penerimaan. Dengan menghitung jumlah pesanan pada setiap proses bisnis, Anda dapat melakukan analisis corong berdasarkan metrik 'jumlah pesanan'. Untuk informasi selengkapnya tentang cara membuat proses bisnis di DataWorks, lihat Proses bisnis.

    • Data mart

      Data mart mendefinisikan subjek bisnis secara rinci untuk suatu kategori bisnis. Data mart menggunakan bidang subjek untuk mempartisi data di mart target berdasarkan perspektif analisis yang berbeda, dengan tujuan akhir menyediakan data analisis statistik bagi aplikasi bisnis. Contohnya adalah data mart platform O&M. Untuk informasi selengkapnya, lihat Data mart.

    • Subject area

      Bidang subjek digunakan untuk membagi data mart berdasarkan perspektif analisis. Biasanya, bidang subjek merupakan kumpulan subjek data yang saling terkait erat. Anda dapat membagi subjek data tersebut ke dalam bidang subjek yang berbeda sesuai fokus bisnis Anda. Sebagai contoh, industri E-dagang sering dibagi menjadi domain transaksi, anggota, dan produk. Untuk informasi selengkapnya, lihat Bidang subjek.

  • Data Standard

    Pemodelan data DataWorks memungkinkan Anda merencanakan dan membuat standar data sebelum pemodelan, atau menetapkannya dari data bisnis selama proses pemodelan. Dengan mendefinisikan batasan untuk tabel lookup, satuan pengukuran, standar bidang, dan kamus penamaan, Anda dapat memastikan konsistensi pemrosesan data selama pemodelan dan penerapan.

    Sebagai contoh, Anda mungkin memiliki tabel registrasi dan tabel logon. Tabel registrasi menyimpan ID anggota di bidang bernama user_id, sedangkan tabel logon menyimpan ID yang sama di bidang bernama userid. Dalam kasus ini, Anda dapat membuat standar bidang terpadu untuk ID anggota yang mencakup tabel lookup untuk pemrosesan data, properti wajib seperti tipe data, panjang, dan nilai default, serta satuan pengukuran. Setelah membuat standar bidang tersebut, Anda dapat mengaitkannya dengan semua bidang ID anggota selama pemodelan untuk memastikan konsistensi.

    Untuk informasi selengkapnya tentang cara membuat standar bidang di DataWorks, lihat Standar bidang.

  • Dimensional Modeling

    Filosofi pemodelan data di DataWorks mengikuti prinsip pemodelan dimensional. Saat menggunakan fitur pemodelan dimensional di DataWorks untuk merancang gudang data:

    • Dimension Table

      Berdasarkan perencanaan domain data bisnis Anda, Anda dapat mengekstrak dimensi yang mungkin digunakan untuk analisis data dari setiap domain. Dimensi tersebut beserta propertinya kemudian disimpan dalam tabel dimensi. Sebagai contoh, saat menganalisis data E-dagang, dimensi yang tersedia beserta propertinya mencakup dimensi pesanan (dengan properti seperti ID pesanan, waktu pembuatan pesanan, ID pembeli, dan ID penjual), dimensi pengguna (dengan properti seperti jenis kelamin dan tanggal lahir), serta dimensi produk (dengan properti seperti ID produk, nama produk, dan waktu pencatatan). Anda dapat membuat tabel dimensi untuk pesanan, pengguna, dan produk, di mana properti dimensi tersebut menjadi bidang dalam tabel dimensi. Setelah diterapkan ke gudang data, Anda dapat menggunakan proses ekstrak, transformasi, dan muat (ETL) untuk menyimpan data dimensi aktual sesuai definisi dalam tabel dimensi, sehingga mempermudah staf bisnis dalam melakukan analisis.

    • Detail Table

      Berdasarkan perencanaan proses bisnis Anda, Anda dapat menganalisis data aktual yang dihasilkan dalam setiap proses dan menyimpan bidang-bidang tersebut dalam tabel detail. Sebagai contoh, untuk proses bisnis 'melakukan pemesanan', Anda dapat membuat tabel detail 'melakukan pemesanan' yang mencatat bidang data seperti ID pesanan, waktu pembuatan pesanan, ID produk, kuantitas, dan jumlah. Setelah diterapkan ke gudang data, Anda dapat menggunakan proses ETL untuk mengagregasi dan menyimpan data aktual sesuai definisi dalam tabel detail, sehingga data siap digunakan untuk analisis bisnis.

    • Aggregate Table

      Berdasarkan analisis data bisnis dan struktur lapisan gudang data Anda, Anda dapat mengagregasi data fakta dan data dimensi dari tabel detail untuk membuat tabel agregat. Untuk analisis data selanjutnya, Anda dapat langsung menggunakan data dari tabel agregat, bukan dari tabel detail dan dimensi.

    • Application table

      Tabel aplikasi dirancang untuk skenario bisnis tertentu dan mengorganisasi data statistik untuk beberapa metrik atom, metrik turunan, atau granularitas statistik yang memiliki periode dan dimensi yang sama. Tabel-tabel ini menyediakan fondasi untuk kueri bisnis, analisis OLAP, dan distribusi data selanjutnya. Anda dapat merancang tabel aplikasi berdasarkan kebutuhan skenario aplikasi Anda.

    • Reverse Modeling

      Pemodelan terbalik terutama digunakan untuk mengimpor model yang dibuat dengan alat pemodelan lain ke dalam fitur pemodelan dimensional DataWorks. Misalnya, jika Anda telah membuat model dengan alat lain dan ingin beralih ke fitur pemodelan data cerdas DataWorks untuk pekerjaan selanjutnya, Anda dapat menggunakan fitur pemodelan terbalik. Fitur ini memungkinkan Anda mengimpor model yang sudah ada ke pemodelan dimensional DataWorks tanpa perlu mengulang pekerjaan pemodelan, sehingga menghemat banyak waktu.

    Untuk informasi selengkapnya tentang cara membuat tabel dimensi, tabel detail, tabel agregat, dan tabel aplikasi, lihat Buat model logis: tabel dimensi, Buat model logis: tabel detail, Buat model logis: tabel agregat, dan Buat model logis: tabel aplikasi. Untuk informasi selengkapnya tentang pemodelan terbalik, lihat Pemodelan terbalik: Lakukan reverse model pada tabel fisik.

  • Data Metric

    Fitur pemodelan data di DataWorks menyediakan fitur Data Metric yang memungkinkan Anda membangun sistem metrik terpadu.

    Sistem metrik terdiri dari Atomic Metrics, Modifiers, Periods, dan Derived Metrics.

    • Atomic Metric: Ukuran dalam suatu proses bisnis, seperti 'jumlah pembayaran' dalam proses bisnis 'membayar pesanan'.

    • Modifier: Kualifikasi yang membatasi cakupan bisnis suatu metrik, seperti membatasi 'jumlah pembayaran' hanya untuk 'produk ibu dan anak'.

    • Period: Rentang waktu atau titik waktu untuk statistik metrik, seperti menentukan periode 'jumlah pembayaran' sebagai '7 hari terakhir'.

    • Derived Metric: Kombinasi dari metrik atom, pengubah, dan periode. Contohnya, 'jumlah pembayaran' untuk 'produk ibu dan anak' dalam '7 hari terakhir'.

    Untuk informasi selengkapnya tentang cara membuat sistem metrik, lihat Data Metric.

Mengapa pemodelan data diperlukan

  • Manajemen terstandarisasi atas data masif

    Semakin luas bisnis perusahaan, semakin kompleks struktur datanya. Volume data meningkat pesat seiring perkembangan bisnis. Menyusun, mengorganisasi, dan menyimpan data ini merupakan tantangan bagi setiap perusahaan.

  • Interkoneksi data bisnis untuk menghilangkan hambatan informasi

    Silo data terbentuk ketika data terisolasi di unit bisnis dan departemen yang berbeda. Hal ini mencegah pengambil keputusan mendapatkan gambaran menyeluruh dan cepat mengenai data perusahaan. Menghilangkan silo informasi antardepartemen atau domain bisnis merupakan tantangan utama dalam manajemen data.

  • Integrasi standar data untuk koneksi terpadu dan fleksibel

    Deskripsi berbeda untuk data yang sama menyulitkan manajemen data, menyebabkan duplikasi konten, dan menghasilkan hasil yang tidak akurat. Aspek penting dari manajemen terstandarisasi adalah menciptakan standar data terpadu dan menghubungkannya secara fleksibel dengan layanan hulu dan hilir tanpa mengganggu arsitektur sistem yang ada.

  • Maksimalisasi nilai data dan keuntungan perusahaan

    Pemanfaatan optimal semua jenis data perusahaan memaksimalkan nilainya dan membantu menyediakan layanan data yang lebih efisien.