全部產品
Search
文件中心

DataWorks:映射Hologres中繼資料至MaxCompute外表

更新時間:Apr 19, 2025

當您需要在MaxCompute訪問Hologres資料時,可通過資料目錄的Hologres中繼資料映射功能建立MaxCompute外部表格,以直接讀取Hologres資料,無需將資料匯入MaxCompute,此方式可以節省計算儲存資源、實現靈活高效的資料處理。

背景資訊

MaxCompute 支援通過外部表格功能對儲存在Hologres等外部儲存系統中的資料進行查詢和分析。藉助PostgreSQL JDBC驅動和RAM角色授權,您無需將資料匯入到MaxCompute內部儲存,即可直接操作外部資料。

在 DataWorks 中,您可以通過中繼資料映射快速實現該操作。此功能底層依託於MaxCompute的以下能力:

前提條件

許可權控制

DataWorks根據MaxCompute專案的來源確認訪問身份,基於此身份,進行後續相關許可權的校正。

根據MaxCompute專案來源確定訪問身份

MaxCompute側訪問身份許可權校正

Hologres側許可權校正

  • MaxCompute來自DataWorks資料來源:訪問身份為資料來源配置的訪問身份。若要將Hologres中繼資料映射至生產資料來源對應的MaxCompute,您需要是DataWorks營運空間管理員

  • MaxCompute來自個人有許可權的專案:訪問身份為當前操作帳號。

  • 在執行Hologres中繼資料映射至MaxCompute時,請確保上述訪問身份已經加入MaxCompute專案。

  • 在通過MaxCompute外表讀取Hologres資料時,請確保上述訪問身份擁有MaxCompute外表讀取許可權。

  • 使用雙簽名身份認證與鑒權:訪問身份擁有Hologres表讀寫權限。

  • 使用RAMROLE身份認證與鑒權:RAMROLE擁有Hologres表讀寫權限。

使用限制

  • 僅支援將Hologres內部資料庫的資料對應至MaxCompute。

  • MaxCompute上Hologres外部表格的使用限制,請參見Hologres外部表格

  • MaxCompute與Hologres的資料類型存在差異,Hologres部分資料類型不支援映射至MaxCompute,不支援映射的資料類型會自動忽略映射。請在使用此功能前仔細閱讀MaxCompute與Hologres的資料類型映射關係,以確保適用您的業務需求。

功能入口

  1. 進入DataWorks工作空間列表頁,在頂部切換至目標地區,找到目標工作空間,單擊操作列的快速進入 > Data Studio,進入Data Studio。

  2. 在左側導覽列單擊image,進入資料目錄

  3. Hologres目錄中定位到需要映射中繼資料至MaxCompute的Schema或表,右鍵選擇中繼資料映射至MaxCompute

Schema級中繼資料映射

Hologres的Schema級中繼資料映射功能會將Hologres的Schema中繼資料統一映射至MaxCompute的外部Schema。操作前,建議您參考湖倉一體2.0使用指南提前瞭解MaxCompute外部資料源與外部Schema。

重要

只支援映射到MaxCompute開啟了三層模型內部專案中。

MaxCompute側:準備Hologres類型外部資料源

Hologres Schema級中繼資料映射是通過在MaxCompute專案中建立外部Schema實現的,該Schema會從外部資料源同步Hologres的中繼資料。因此,您需先在DataWorks中建立指向目標Hologres資料庫的MaxCompute外部資料源,並將MaxCompute外部資料源掛載至指定MaxCompute內部專案,以建立MaxCompute內部專案下外部Schema與Hologres指定資料庫的映射。

建立MaxCompute外部資料源,詳情請參見建立並使用Hologres聯邦

說明

建立外部資料源時,Host請填寫傳統網路地址,暫不支援使用VPC地址。DB請配置需要進行中繼資料映射的Hologres 資料庫。

DataWorks側:配置Hologres Schema級中繼資料映射

  1. 進入中繼資料映射配置頁面

  2. 在Hologres專案下找到需要映射資料至MaxCompute的Schema。按右鍵Schema名,選擇中繼資料映射至MaxCompute,進入中繼資料映射配置頁面。

  3. 配置Schema資料對應相關參數。

    • Hologres 源端

      參數

      說明

      源端物件類型

      確認需要映射Schema資料至MaxCompute的物件類型,固定為Hologres Schema

      源端對象名稱

      確認需要映射Schema資料至MaxCompute的Hologres Schema名稱,固定為當前選擇的Schema。

      格式:<hologres_database>.<hologres_schema>

      說明

      您需要提前在MaxCompute建立Hologres類型外部資料源,並指定外部資料源預設訪問的Hologres資料庫為此處的<hologres_database>,詳情參見MaxCompute側:準備Hologres類型外部資料源

    • MaxCompute 目標端

      參數

      說明

      專案尋找方式

      選擇如何尋找MaxCompute專案。

      • 來自DataWorks資料來源:通過選擇當前空間綁定MaxCompute資料來源的方式來選擇其對應的MaxCompute執行個體。選擇此方式後,還需要選擇資料來源並設定外部Schema名稱,在目標MaxCompute專案中建立外部Schema。

        說明

        僅擁有工作空間營運角色或者管理員角色的使用者可選擇生產資料來源。

      • 我有許可權的:從當前阿里雲主帳號下,您有許可權訪問的MaxCompute專案中選擇需要映射的目標MaxCompute專案。選擇此方式後,還需要設定外部Schema名稱來指定目標Schema。

      資料來源

      專案尋找方式配置為來自DataWorks資料來源時,需要手動選擇MaxCompute資料來源。

      專案名稱

      專案尋找方式配置為我有許可權的時,需要手動選擇MaxCompute專案。

      外部Schema名稱

      指定源端Hologres Schema下的中繼資料映射至目標MaxCompute的外部Schema名稱。

      外部資料源

      選擇已經和源端Hologres資料庫建立串連的MaxCompute外部資料源名稱

      重要

      建立MaxCompute外部資料源時:

      • Host請填寫傳統網路地址,暫不支援使用VPC地址。

      • 認證方式僅支援選擇RAMRole方式,暫不支援ExecuteWithUserAuth方式。

      Auth

      根據選擇的外部資料源自動產生。

      Host:port

      Database

  4. 單擊頂部工具列的運行按鈕,完成Hologres Schema級資料對應。

單表級中繼資料映射

Hologres單表級中繼資料映射功能將指定Hologres表通過外表方式映射至MaxCompute的指定表中,支援您指定外表路徑以及自訂外表名稱。

  1. 進入中繼資料映射配置頁面

  2. 在Hologres專案下找到需要映射中繼資料至MaxCompute的Hologres表。按右鍵表名,選擇中繼資料映射至MaxCompute,進入中繼資料映射配置頁面。

  3. 配置單表級中繼資料映射相關參數。

    • Hologres 源端

      參數

      說明

      源端物件類型

      確認需要映射單表級中繼資料至MaxCompute的物件類型,預設為Hologres Table

      源端對象名稱

      確認需要映射單表級中繼資料至MaxCompute的Hologres表,固定為當前選擇的Hologres表。

    • MaxCompute 目標端

      參數

      說明

      執行個體尋找方式

      選擇如何尋找MaxCompute專案。

      • 來自DataWorks資料來源:通過選擇當前空間綁定MaxCompute資料來源的方式來選擇其對應的MaxCompute專案。選擇此方式後,還需要選擇資料來源、設定External Table名稱來指定目標MaxCompute專案的具體外部表格。選擇該方式,您需要確保資料來源指定的訪問身份已擁有源Hologres表與目標MaxCompute的讀寫權限。

        說明

        僅擁有工作空間營運角色或者管理員角色的使用者可選擇生產資料來源。

      • 我有許可權的:從當前阿里雲主帳號下,您有許可權訪問的MaxCompute專案中選擇需要映射的目標MaxCompute專案。選擇此方式後,還需要設定External Table名稱來指定目標外表。請確保您已擁有源Hologres表與目標MaxCompute的讀寫權限。

      資料來源

      專案尋找方式配置為來自DataWorks資料來源時,需要手動選擇目標端MaxCompute資料來源。

      專案名稱

      專案尋找方式配置為我有許可權的時,需要手動選擇目標端MaxCompute專案。

      Schema

      指定源端Hologres Schema下的中繼資料映射至目標MaxCompute的外部Schema名稱。

      External Table

      定義指定MaxCompute專案的Schema下建立的新的外表名稱,源端表資料將會被映射至此表中,預設與Hologres中表名稱保持一致。

      說明

      建立外表為一次性動作,不會自動重新整理中繼資料,如需重新整理中繼資料,需要刪除當前外表並重新手動建立中繼資料映射。

      MaxCompute外表許可權

      定義Hologres中繼資料映射至MaxCompute外表後,該外表的許可權認證及鑒權方式。

      • 雙簽名

        雙簽名是MaxCompute和Hologres共同研發的認證及鑒權協議,在MaxCompute側使用帳號登入資訊加簽名後,把認證資料傳遞給Hologres側,Hologres根據MaxCompute底層達成的協議,進行同名認證及鑒權。因此,只需在MaxCompute與Hologres中使用相同的帳號,便可直接進行外部表格訪問,無需額外設定認證資訊。

      • RamRole:即通過STS模式進行認證及鑒權。

      RoleARN

      MaxCompute外表許可權配置為RamRole時,需要配置。

      您需要建立RAM角色並擷取ARN資訊填寫至此處,RAM角色需要配置的相關許可權,請參見建立Hologres外部表格(STS模式)

      Location

      Hologres表與MaxCompute表的映射地址,自動產生,無需修改。

      生命週期

      設定目標外表的生命週期。

      欄位

      按需配置目標外表中的MaxCompute 欄位MaxCompute 資料類型

      說明

      MaxCompute與Hologres的資料類型存在差異,部分資料類型不支援映射。具體資料類型映射關係,請參見MaxCompute與Hologres的資料類型映射

  4. 單擊頂部運行按鈕,完成Hologres表級資料對應。

後續步驟

  • 資料目錄 > MaxCompute下查看已映射的外部Schema或指定Schema下的外表。

  • 資料開發 > MaxCompute SQL節點中查詢Hologres外表的資料。