Di DataWorks, Model Logis berfungsi sebagai cetak biru untuk desain data. Memublikasikan model akan melakukan materialisasi menjadi Tabel Fisik atau Tampilan di mesin komputasi, seperti MaxCompute atau Hologres, guna mendukung pengembangan dan analisis data.
Batasan
Sebelum memublikasikan model, pastikan Anda memenuhi kondisi berikut:
Mesin target: Anda dapat memublikasikan model ke MaxCompute, Hologres, E-MapReduce (EMR) Hive, CDH, dan MySQL.
Jenis Publikasi:
Saat memublikasikan sebagai View atau Materialized View, mesin target harus berupa MaxCompute.
Saat memublikasikan model sebagai Materialized View, Publish Mode harus diatur ke Delete and Recreate.
Lingkungan:
Di ruang kerja dalam mode dasar, Anda hanya dapat memublikasikan ke lingkungan Production.
Di ruang kerja dalam mode standar, Anda dapat memublikasikan ke lingkungan Development atau Production.
Kelompok Sumber Daya:
Saat mesin target adalah E-MapReduce (EMR) Hive atau CDH, Anda harus menentukan Exclusive Resource Group for Scheduling atau Serverless Resource Group untuk menjalankan tugas publikasi.
Menerbitkan dan mewujudkan sebuah model
Anda dapat memublikasikan dan melakukan materialisasi Tabel Dimensi, Tabel Fakta, Tabel Agregat, atau Tabel Aplikasi ke instans sumber data. Tabel-tabel yang telah dimaterialisasi tersebut kemudian dapat digunakan oleh mesin komputasi untuk pengembangan dan analisis data. Anda dapat memublikasikan tabel ke mesin MaxCompute, Hologres, E-MapReduce (EMR) Hive, CDH, dan MySQL.
Publikasikan model.
Setelah membuat model, klik ikon
di bilah alat pada halaman detail tabel. Di kotak dialog Publish, konfigurasikan parameter berikut.
Parameter
Deskripsi
Publish Type
Tentukan format materialisasi untuk model.
Physical Table: Membuat tabel fisik di mesin target.
View: Membuat tampilan di mesin target. Opsi ini hanya didukung untuk sumber data MaxCompute.
Materialized View: Membuat tampilan yang di-materialisasi di mesin target. Opsi ini hanya didukung untuk sumber data MaxCompute. Materialized view merupakan bentuk prekomputasi yang menyimpan hasil operasi mahal, seperti JOIN dan agregasi. Kueri kemudian dapat menggunakan kembali hasil tersebut untuk menghindari pengulangan operasi tersebut, sehingga mempercepat performa. Untuk informasi selengkapnya, lihat Operasi Materialized View.
Data Source Type
Pilih mesin tempat data disimpan. Opsi yang tersedia adalah MaxCompute, E-MapReduce (EMR) Hive, Hologres, CDH, dan MySQL.
Effective Environment
Lingkungan tempat Anda ingin memublikasikan model. Anda dapat memilih Development atau Production.
Jika Anda menggunakan ruang kerja DataWorks dalam mode dasar, Anda hanya dapat memublikasikan tabel ke lingkungan Production.
Jika Anda menggunakan ruang kerja DataWorks dalam mode standar, Anda dapat memublikasikan tabel ke lingkungan Production atau Development.
Publish Mode
Metode yang digunakan untuk memublikasikan model.
Incremental Publish: Hanya menerapkan perubahan model ke mesin target. Mode ini direkomendasikan untuk model yang sebelumnya telah dipublikasikan guna mempertahankan data historis dan meminimalkan dampak terhadap layanan online.
Delete and Recreate: Menghapus tabel yang sudah ada dengan nama yang sama di mesin target, lalu membuat ulang. Penting: Operasi ini akan menghapus dan membuat ulang tabel, sehingga menyebabkan kehilangan data historis.
Saat model dipublikasikan untuk pertama kalinya, kedua mode memiliki efek yang sama.
Automatic Rule Generation Based on Field Standard
Tentukan apakah aturan kualitas akan dibuat secara otomatis setelah model dipublikasikan. Untuk informasi selengkapnya, lihat Pelabelan Data.
Yes: Setelah model berhasil dipublikasikan ke lingkungan Production, sistem secara otomatis menghasilkan aturan kualitas untuk bidang yang didefinisikan sebagai Primary Key, bidang dengan kendala NOT NULL, atau bidang yang dikaitkan dengan kode standar.
No: Tidak menghasilkan aturan kualitas secara otomatis.
Resource Group
Parameter ini wajib diisi saat Anda melakukan materialisasi model sebagai Physical Table di E-MapReduce (EMR) Hive atau CDH. Pastikan kelompok sumber daya yang dipilih memiliki konektivitas jaringan ke sumber data.
CatatanUntuk memublikasikan tabel fisik ke E-MapReduce atau CDH, Anda harus menggunakan Exclusive Resource Group for Scheduling.
Jika Anda tidak memiliki Exclusive Resource Group for Scheduling yang sesuai, lihat Gunakan Exclusive Resource Group for Scheduling untuk membuat satu.
DDL
Untuk memublikasikan Materialized View, pernyataan
SELECTdalam definisinya harus dapat dieksekusi. Anda harus mengedit klausaAS SELECTagar menjadi pernyataan SQL yang valid.CatatanParameter ini wajib diisi hanya saat Anda memublikasikan model sebagai Materialized View.
Untuk informasi selengkapnya tentang operasi DDL untuk materialized view, lihat Operasi Materialized View.
Setelah menyelesaikan konfigurasi, klik Publish. Sistem akan memublikasikan model ke lingkungan Development atau Production yang sesuai dan melakukan materialisasi di mesin yang dipilih.
Anda dapat melihat progres saat ini dan log terkait di kotak dialog Publish.
Anda dapat memublikasikan model lagi ke lingkungan yang berbeda.
Opsi tambahan: Setelah model dipublikasikan, Anda dapat mengklik ikon
di bilah alat pada halaman detail tabel untuk melihat detail operasi publikasi terbaru.Publishing Status mencakup tiga status: Succeeded, Failed, dan Publishing. Log untuk status Succeeded ditampilkan pada gambar di bawah ini.
CatatanJika Publishing Status bernilai Failed, identifikasi dan perbaiki masalah berdasarkan pesan error.
Jika kotak dialog Publishing Logs menampilkan No publishing logs found., artinya model belum pernah dipublikasikan.
Lihat catatan publikasi
Setelah model berhasil dipublikasikan, Anda dapat membuka halaman edit model dan mengklik Publishing Record di panel navigasi sebelah kanan untuk melihat detail versi yang telah dipublikasikan sebelumnya.

Hasilkan kerangka kode ETL
Di Pemodelan Data Cerdas DataWorks, Anda dapat menggunakan fitur Pengembangan Model untuk menghasilkan Kerangka Kode ETL untuk tabel model yang telah dipublikasikan, seperti Tabel Dimensi dan Tabel Fakta.
Fitur Pengembangan Model hanya mendukung pembuatan kode untuk tabel model yang dipublikasikan ke mesin komputasi MaxCompute dan E-MapReduce (EMR) Hive.
Di Pemodelan Data Cerdas DataWorks, klik ganda tabel model yang telah dipublikasikan untuk membuka halaman detailnya.
Di bilah aksi, klik Develop Model.
Di kotak dialog Develop Model, pilih Create DataStudio Node atau Associate DataStudio Node, konfigurasikan parameter, lalu klik OK.
Pilih Create DataStudio Node

Sistem secara otomatis membuat node DataStudio dan mengisi nama node berdasarkan nama tabel.
Jika tabel model dipublikasikan ke mesin MaxCompute, node ODPS SQL akan dibuat.
Jika tabel model dipublikasikan ke mesin E-MapReduce (EMR) Hive, node EMR Hive akan dibuat.
Setelah mengonfirmasi konfigurasi, klik Go to DataStudio. Sistem secara otomatis membuka kotak dialog pembuatan node di DataStudio. Klik OK untuk membuat node dan menghasilkan kode ETL.
Pilih Associate DataStudio Node

Opsi ini mengaitkan kerangka kode dengan node DataStudio yang sudah ada dengan jenis mesin yang sama. Setelah pengikatan berhasil, Anda dapat mengklik nama node untuk membuka halaman node terkait dan melanjutkan pengembangan.
Jika Anda perlu mengaitkan beberapa node ke tabel model yang sama, Anda dapat mengklik kembali Develop Model untuk mengikat node lainnya.
Tagihan
Fitur publikasi model gratis. Namun, Anda akan dikenai biaya atas sumber daya komputasi dan penyimpanan yang digunakan selama proses materialisasi:
Biaya mesin target: Setelah model dimaterialisasi, Anda akan ditagih atas sumber daya penyimpanan dan komputasi yang dikonsumsi di mesin target (seperti MaxCompute atau Hologres) sesuai dengan harga produk terkait.