全部產品
Search
文件中心

DataWorks:發布模型

更新時間:Dec 24, 2025

DataWorks中的邏輯模型是資料設計的藍圖。發布模型可將邏輯模型物化為MaxCompute、Hologres等物理引擎中的物理表或視圖,用於後續的資料開發與分析。

限制條件

發布模型前,需滿足以下條件:

  • 目標引擎:支援發布至 MaxComputeHologresEMR HiveCDHMySQL 引擎。

  • 發布類型

    • 發布為視圖或物化視圖時,目標引擎僅支援 MaxCompute

    • 發布為物化視圖時,發布模式僅支援刪除重建

  • 環境

    • 簡單模式工作空間:僅支援發布至生產環境。

    • 標準模式工作空間:支援發布至開發生產環境。

  • 資源群組

    • 當目標引擎為EMR Hive或 CDH 時,必須指定獨享調度資源群組Serverless資源群組執行發布任務。

發布並物化模型

維度資料表、明細表、匯總表、應用表可直接發布物化至建立的資料來源執行個體中,用於後續計算引擎進行資料開發、資料分析等。當前支援將表直接發布物化至MaxCompute、Hologres、EMR Hive、CDH、MySQL引擎。

  1. 發布模型。

    模型建立完成後,您可單擊表詳情頁頂部功能表列的發布表徵圖,在彈出的發布對話方塊中配置如下關鍵參數。發布設定

    參數

    描述

    發布類型

    設定模型物化的形態。

    • 物理表:在目標引擎中建立一張物理表。

    • 視圖:在目標引擎中建立一個視圖,僅支援MaxCompute資料來源類型。

    • 物化視圖:在目標引擎中建立一個物化視圖,僅支援MaxCompute資料來源類型。本質是一種預計算,即把某些耗時的操作(例如JOIN、AGGREGATE)的結果儲存下來,以便在查詢時直接複用,從而避免這些耗時的操作,最終達到加速查詢的目的。更多介紹詳情請參見物化視圖操作

    數據源類型

    選擇資料存放區的引擎,目前可選如下幾類:MaxComputeEMR HiveHologresCDHMySQL

    生效環境

    可選擇發布至開發生產環境。

    • 如果您使用的是簡單模式的DataWorks工作空間,則僅支援發行資料表到生產環境。

    • 如果您使用的是標準模式的DataWorks工作空間,則支援發行資料表到生產環境或開發環境。

    發布模式

    • 定義模型發布到目標引擎的方式。

      • 增量發布:僅將當前模型的變更部分更新至目標引擎。建議對發行的模型使用此模式,以保留歷史資料並減少對線上業務的影響。

      • 刪除重建:先刪除目標引擎中已存在的同名模型,然後重新建立。注意:此操作將刪除並重建表,導致歷史資料丟失。

      首次發布時,兩種模式效果相同。

    自動落標

    設定模型發布後,是否自動產生品質規則。詳情參見資料落標

    • 是:發布生產環境成功後,針對主鍵、非空及關聯標準代碼的欄位自動產生品質規則。

    • 否:不自動產生品質規則。

    資源組

    選擇模型表物化為E-MapReduceCDH的物理表時,資源群組必填。請確保所選資源群組與資料來源之間的網路連通

    說明
    • 發布E-MapReduce或CDH的物理表僅支援使用獨享調度資源群組。

    • 如果您沒有合適的獨享調度資源群組,則可參考使用獨享調度資源群組建立。

    DDL

    DataWorks根據模型配置自動為您產生發布為物化視圖的SQL語句。由於SELECT語句必須執行成功此處發布才會成功,因此您需手動修改AS SELECT語句為可執行檔SQL語句。

    說明
    • 僅當選擇發布模型為物化視圖時,需配置該參數。

    • 物化視圖的DDL操作,詳情請參見物化視圖操作

  2. 配置完成後單擊發布,系統會將模型發布至對應的開發生產環境,並物化至所選引擎。

    • 支援在發布對話方塊查看當前發布進度及相關日誌

    • 支援重複執行發佈動作將模型發布至不同的環境中。

  3. 可選:發布完成後,您可單擊表詳情頁頂部功能表列的日誌表徵圖,查看最近一次發佈動作的發布結果以及發布的詳細資料。

    其中,發布狀態包含發布成功發布失敗發布中三種狀態。發布成功的日誌如下圖所示。

    發布日誌

    說明
    • 發布狀態發布失敗時,您需要根據具體的報錯資訊儘快定位原因並處理。

    • 發布日誌對話方塊顯示暫無發布日誌。表示模型從未被發布過。

  4. 查看發布記錄

    模型發布成功後,您可進入模型的編輯頁面,單擊右側導覽列的發布記錄,查看模型歷史發布版本的詳情。image

產生 ETL 代碼架構(模型開發)

在DataWorks智能資料建模中,可使用模型開發功能,為發行的模型表(如維度資料表、明細表)產生ETL代碼架構。

說明

模型開發功能僅支援為發布至MaxCompute和EMR Hive計算引擎的模型表產生代碼。

  1. 在DataWorks智能資料建模中,雙擊發行的模型表,進入表詳情頁面。

  2. 單擊操作欄的模型開發

  3. 在彈出的模型開發對話方塊中,選擇新建 DataStudio 節點綁定 DataStudio 節點,配置相關參數後單擊確定

    1. 選擇新建 DataStudio 節點

      PixPin_2025-12-22_16-16-44

      系統將自動建立DataStudio節點,並根據表名自動填滿節點名稱。

      • 若模型表發布至MaxCompute引擎,則建立ODPS SQL節點。

      • 若模型表發布至EMR Hive引擎,則建立EMR Hive節點。

      確認配置資訊後,單擊去 DataStudio。系統會在資料開發自動產生建立節點的彈窗,點擊確定即可建立節點並產生ETL代碼。

    2. 選擇綁定 DataStudio 節點

      PixPin_2025-12-22_16-17-17

      將代碼架構關聯至一個已有的、相同引擎類型的DataStudio節點。綁定成功後,可單擊節點名稱跳轉至對應的節點頁面繼續開發。

說明

如果需要為同一個模型表關聯多個節點,可再次單擊模型開發進行綁定。

計費說明

發布模型功能本身不收費。物化過程中涉及的計算和儲存資源將產生費用:

目標引擎費用:模型物化後,在目標引擎(如MaxCompute、Hologres)中佔用的儲存資源和後續的計算資源,按對應產品的計費規則收費。