當您需要在MaxCompute訪問Hologres資料時,可通過資料目錄的Hologres中繼資料映射功能建立MaxCompute外部表格,以直接讀取Hologres資料,無需將資料匯入MaxCompute,此方式可以節省計算儲存資源、實現靈活高效的資料處理。
背景資訊
MaxCompute 支援通過外部表格功能對儲存在Hologres等外部儲存系統中的資料進行查詢和分析。藉助PostgreSQL JDBC驅動和RAM角色授權,您無需將資料匯入到MaxCompute內部儲存,即可直接操作外部資料。
在 DataWorks 中,您可以通過中繼資料映射快速實現該操作。此功能底層依託於MaxCompute的以下能力:
Schema級中繼資料映射:通過MaxCompute的外部Schema能力實現。
前提條件
已在資料目錄中添加Hologres執行個體。
Schema級中繼資料映射需要使用MaxCompute外部資料源,請提前在MaxCompute建立Hologres類型外部資料源。
重要建立MaxCompute外部資料源時:
Host請填寫傳統網路地址,暫不支援使用VPC地址。
認證方式僅支援選擇RAMRole方式,暫不支援ExecuteWithUserAuth方式。
許可權控制
DataWorks根據MaxCompute專案的來源確認訪問身份,基於此身份,進行後續相關許可權的校正。
根據MaxCompute專案來源確定訪問身份 | MaxCompute側訪問身份許可權校正 | Hologres側許可權校正 |
|
|
|
使用限制
僅支援將Hologres內部資料庫的資料對應至MaxCompute。
MaxCompute上Hologres外部表格的使用限制,請參見Hologres外部表格。
MaxCompute與Hologres的資料類型存在差異,Hologres部分資料類型不支援映射至MaxCompute,不支援映射的資料類型會自動忽略映射。請在使用此功能前仔細閱讀MaxCompute與Hologres的資料類型映射關係,以確保適用您的業務需求。
功能入口
進入DataWorks工作空間列表頁,在頂部切換至目標地區,找到目標工作空間,單擊操作列的,進入Data Studio。
在左側導覽列單擊
,進入資料目錄。在Hologres目錄中定位到需要映射中繼資料至MaxCompute的Schema或表,右鍵選擇中繼資料映射至MaxCompute。
Schema級中繼資料映射
Hologres的Schema級中繼資料映射功能會將Hologres的Schema中繼資料統一映射至MaxCompute的外部Schema。操作前,建議您參考湖倉一體2.0使用指南提前瞭解MaxCompute外部資料源與外部Schema。
只支援映射到MaxCompute開啟了三層模型的內部專案中。
MaxCompute側:準備Hologres類型外部資料源
Hologres Schema級中繼資料映射是通過在MaxCompute專案中建立外部Schema實現的,該Schema會從外部資料源同步Hologres的中繼資料。因此,您需先在DataWorks中建立指向目標Hologres資料庫的MaxCompute外部資料源,並將MaxCompute外部資料源掛載至指定MaxCompute內部專案,以建立MaxCompute內部專案下外部Schema與Hologres指定資料庫的映射。
建立MaxCompute外部資料源,詳情請參見建立並使用Hologres聯邦。
建立外部資料源時,Host請填寫傳統網路地址,暫不支援使用VPC地址。DB請配置需要進行中繼資料映射的Hologres 資料庫。
DataWorks側:配置Hologres Schema級中繼資料映射
在Hologres專案下找到需要映射資料至MaxCompute的Schema。按右鍵Schema名,選擇中繼資料映射至MaxCompute,進入中繼資料映射配置頁面。
配置Schema資料對應相關參數。
Hologres 源端
參數
說明
源端物件類型
確認需要映射Schema資料至MaxCompute的物件類型,固定為
Hologres Schema。源端對象名稱
確認需要映射Schema資料至MaxCompute的Hologres Schema名稱,固定為當前選擇的Schema。
格式:
<hologres_database>.<hologres_schema>。說明您需要提前在MaxCompute建立Hologres類型外部資料源,並指定外部資料源預設訪問的Hologres資料庫為此處的
<hologres_database>,詳情參見MaxCompute側:準備Hologres類型外部資料源。MaxCompute 目標端
參數
說明
專案尋找方式
選擇如何尋找MaxCompute專案。
來自DataWorks資料來源:通過選擇當前空間綁定MaxCompute資料來源的方式來選擇其對應的MaxCompute執行個體。選擇此方式後,還需要選擇資料來源並設定外部Schema名稱,在目標MaxCompute專案中建立外部Schema。
說明僅擁有工作空間營運角色或者管理員角色的使用者可選擇生產資料來源。
我有許可權的:從當前阿里雲主帳號下,您有許可權訪問的MaxCompute專案中選擇需要映射的目標MaxCompute專案。選擇此方式後,還需要設定外部Schema名稱來指定目標Schema。
資料來源
專案尋找方式配置為來自DataWorks資料來源時,需要手動選擇MaxCompute資料來源。
專案名稱
專案尋找方式配置為我有許可權的時,需要手動選擇MaxCompute專案。
外部Schema名稱
指定源端Hologres Schema下的中繼資料映射至目標MaxCompute的外部Schema名稱。
外部資料源
選擇已經和源端Hologres資料庫建立串連的MaxCompute外部資料源名稱。
重要建立MaxCompute外部資料源時:
Host請填寫傳統網路地址,暫不支援使用VPC地址。
認證方式僅支援選擇RAMRole方式,暫不支援ExecuteWithUserAuth方式。
Auth
根據選擇的外部資料源自動產生。
Host:port
Database
單擊頂部工具列的運行按鈕,完成Hologres Schema級資料對應。
單表級中繼資料映射
Hologres單表級中繼資料映射功能將指定Hologres表通過外表方式映射至MaxCompute的指定表中,支援您指定外表路徑以及自訂外表名稱。
在Hologres專案下找到需要映射中繼資料至MaxCompute的Hologres表。按右鍵表名,選擇中繼資料映射至MaxCompute,進入中繼資料映射配置頁面。
配置單表級中繼資料映射相關參數。
Hologres 源端
參數
說明
源端物件類型
確認需要映射單表級中繼資料至MaxCompute的物件類型,預設為
Hologres Table。源端對象名稱
確認需要映射單表級中繼資料至MaxCompute的Hologres表,固定為當前選擇的Hologres表。
MaxCompute 目標端
參數
說明
執行個體尋找方式
選擇如何尋找MaxCompute專案。
來自DataWorks資料來源:通過選擇當前空間綁定MaxCompute資料來源的方式來選擇其對應的MaxCompute專案。選擇此方式後,還需要選擇資料來源、設定External Table名稱來指定目標MaxCompute專案的具體外部表格。選擇該方式,您需要確保資料來源指定的訪問身份已擁有源Hologres表與目標MaxCompute的讀寫權限。
說明僅擁有工作空間營運角色或者管理員角色的使用者可選擇生產資料來源。
我有許可權的:從當前阿里雲主帳號下,您有許可權訪問的MaxCompute專案中選擇需要映射的目標MaxCompute專案。選擇此方式後,還需要設定External Table名稱來指定目標外表。請確保您已擁有源Hologres表與目標MaxCompute的讀寫權限。
資料來源
專案尋找方式配置為來自DataWorks資料來源時,需要手動選擇目標端MaxCompute資料來源。
專案名稱
專案尋找方式配置為我有許可權的時,需要手動選擇目標端MaxCompute專案。
Schema
指定源端Hologres Schema下的中繼資料映射至目標MaxCompute的外部Schema名稱。
External Table
定義指定MaxCompute專案的Schema下建立的新的外表名稱,源端表資料將會被映射至此表中,預設與Hologres中表名稱保持一致。
說明建立外表為一次性動作,不會自動重新整理中繼資料,如需重新整理中繼資料,需要刪除當前外表並重新手動建立中繼資料映射。
MaxCompute外表許可權
定義Hologres中繼資料映射至MaxCompute外表後,該外表的許可權認證及鑒權方式。
RoleARN
當MaxCompute外表許可權配置為RamRole時,需要配置。
您需要建立RAM角色並擷取ARN資訊填寫至此處,RAM角色需要配置的相關許可權,請參見建立Hologres外部表格(STS模式)。
Location
Hologres表與MaxCompute表的映射地址,自動產生,無需修改。
生命週期
設定目標外表的生命週期。
欄位
按需配置目標外表中的MaxCompute 欄位和MaxCompute 資料類型。
說明MaxCompute與Hologres的資料類型存在差異,部分資料類型不支援映射。具體資料類型映射關係,請參見MaxCompute與Hologres的資料類型映射。
單擊頂部運行按鈕,完成Hologres表級資料對應。
後續步驟
在下查看已映射的外部Schema或指定Schema下的外表。
在節點中查詢Hologres外表的資料。