MaxCompute支援您將MaxCompute專案資料接入Davinci,您只需在可視化UI介面上簡單配置即可服務多種資料視覺效果應用。本文為您介紹如何使用Davinci通過MaxCompute JDBC驅動,串連MaxCompute專案,並進行可視化資料分析。
背景資訊
Davinci是面向業務人員、資料工程師、資料分析師及資料科學家,提供一站式資料視覺效果的解決方案。您可以在可視化介面上通過簡單配置分析資料,還可以實現進階互動、行業分析、模式探索和社交智能等功能。更多資訊,請參見Davinci。
前提條件
在執行操作前,請確認您已滿足如下條件:
已建立MaxCompute專案。
更多操作,請參見建立MaxCompute專案。
已擷取可訪問MaxCompute專案的AccessKey ID和AccessKey Secret。
您可以進入AccessKey管理頁面擷取。
已下載包含完整依賴JAR包
jar-with-dependencies的MaxCompute JDBC驅動(v3.0.1及以上版本)。說明本文中的MaxCompute JDBC驅動樣本版本為v3.2.9。
已安裝並配置Davinci。
您可以按照Davinci官方資料安裝並配置,具體請參見安裝並配置Davinci。您還可以通過Docker方式安裝Davinci,並成功掛載MaxCompute JDBC驅動。
配置Davinci和掛載驅動過程中您需要注意正確配置MaxCompute相關資訊,請參見配置Davinci和掛載驅動注意事項。
配置Davinci和掛載驅動注意事項
您在配置Davinci和掛載驅動過程中,需要注意正確填寫如下資訊:
Mail配置
#config/application.yml檔案配置資訊。 mail: #SMTP服務地址。 host: #SMTP服務連接埠。 port: #個人郵箱地址 username: #無需填寫 fromAddress: #個人郵箱授權碼,注意非郵箱密碼。 password: #郵箱暱稱,例如Davinci nickname: #如下配置項保持預設值即可。 properties: smtp: starttls: enable: true required: true auth: true mail: smtp: ssl: enable: true自訂資料來源配置
如果您按照Davinci官方資料安裝Davinci,開啟自訂資料來源設定檔datasource_driver.yml,配置如下。
odps: name: odps desc: odps version: driver: com.aliyun.odps.jdbc.OdpsDriver keyword_prefix: keyword_suffix: alias_prefix: \` alias_suffix: \`配置完成後,將MaxCompute JDBC驅動JAR包拷貝至lib目錄下,並重啟Davinci服務。
如果您按照Docker方式安裝Davinci,需要先手動建立一個資料來源設定檔datasource_driver.yml,使用命令
vim docker-compose.yml開啟設定檔,配置如下。volumes: - %odps-jdbc-x.x.x-jar-with-dependencies.jar所在路徑%/odps-jdbc-x.x.x-jar-with-dependencies.jar:/opt/davinci/lib/odps-jdbc-x.x.x-jar-with-dependencies.jar - %datasource_driver.yml所在路徑%/datasource_driver.yml:/opt/davinci/config/datasource_driver.ymlodps-jdbc-x.x.x-jar-with-dependencies.jar為MaxCompute JDBC驅動JAR包名稱,例如odps-jdbc-3.2.9-jar-with-dependencies.jar。配置完成後,重啟Davinci服務。
步驟一:串連Davinci和MaxCompute
確保Davinci安裝及配置正確,若啟動失敗,需重新檢查配置資訊,請參見配置Davinci和掛載驅動注意事項。
啟動並登入Davinci服務。
在Davinci服務介面,單擊右上方建立,建立專案並儲存。
進入建立專案,在左側導覽列,單擊
表徵圖後,單擊
表徵圖在新增Source對話方塊配置下表所列參數資訊。參數
說明
名稱
建立資料連線的名稱,用於在系統中區分不同資料庫的串連。
類型
用於串連MaxCompute專案的驅動程式。固定取值為JDBC,無需修改。
資料庫
目標資料庫類型。固定取值為odps,無需修改。
使用者名稱
具備目標MaxCompute專案存取權限的AccessKey ID。
您可以進入AccessKey管理頁面擷取AccessKey ID。
密碼
AccessKey ID對應的AccessKey Secret。
串連Url
串連MaxCompute專案的URL。格式為
jdbc:odps:<Maxcompute_endpoint>?project=<Maxcompute_project_name>[&interactiveMode={true|false}]。配置時刪除<>符號。參數說明如下:<MaxCompute_endpoint>:必填。MaxCompute專案所屬地區的Endpoint。
各地區的Endpoint資訊,請參見Endpoint。
<MaxCompute_project_name>:必填。待串連的目標MaxCompute專案名稱。
此處為MaxCompute專案名稱,非工作空間名稱。您可以登入MaxCompute控制台,左上方切換地區後,即可在專案管理頁面查看到具體的MaxCompute專案名稱。
interactiveMode:可選。查詢加速功能開關。
如果您需要啟用查詢加速功能,在URL後追加
&interactiveMode=true配置即可。更多查詢加速功能資訊,請參見查詢加速。
單擊點擊測試,串連成功後單擊儲存,完成Davinci和MaxCompute串連。
步驟二:使用Davinci查詢及分析資料
您可以通過Davinci資料檢視(View)管理SQL模板,和對執行SQL後擷取到的資料模型以及行列許可權進行配置,之後可以通過使用可視化組件(Widget)依據資料檢視(View)提供的資料模型對SQL結果進行二次彙總分組,然後將二次加工的資料進行可視化編碼。您可以執行如下操作,更多操作請參見Davinci協助。
查看所有表
在資料檢視列表頁,單擊右上方
表徵圖進入SQL編輯器,選擇建立的資料來源,即可查看所有表。查看錶結構
在資料檢視列表頁,單擊右上方
表徵圖進入SQL編輯器,選擇建立的資料來源,編寫並運行SQL指令碼後,單擊下一步,即可查看錶結構資訊。查看錶資料
在資料檢視列表頁,單擊右上方
表徵圖進入SQL編輯器,選擇建立的資料來源,編寫SQL指令碼後,單擊執行,即可查看錶資料資訊。可視化分析資料
在可視化組件頁面,單擊右上方
表徵圖進入圖表編輯器,選擇圖表類型並配置屬性後,即可根據實際業務訴求開展資料分析。