Dataphin提供租戶級的三方庫管理功能。在Dataphin中進行Python計算任務開發時,若需要使用Python三方庫進行開發,需要通過三方庫功能安裝Python Module後,才可以在計算任務中正常引用。本文將為您介紹如何使用Dataphin三方庫管理進行Python計算任務開發。
案例說明
本案例以使用xlrd三方庫為例。
操作步驟
步驟一:安裝Python Module。
在Dataphin首頁,單擊頂部功能表列管理中心->系統設定。
按照以下操作指引,進入安裝Python Module對話方塊。
依次單擊Python三方包->Python Module->安裝Python Module。

在安裝Python Module對話方塊中,配置參數。
參數
描述
Module 名稱
填寫xlrd。
Python 版本
選擇Python 3.7版本。
安裝方式
選擇線上安裝方式。
單擊確定,等待
xlrd模組完成安裝。
步驟二:建立Python計算任務並引入三方庫
在Dataphin首頁,單擊頂部功能表列研發->資料研發。
按照以下操作指引,進入建立PYTHON任務對話方塊。
選擇專案(Dev-Prod模式需要選擇環境)->單擊計算任務->單擊
建立表徵圖->單擊PYTHON。
在建立PYTHON任務對話方塊,配置參數。
參數
描述
任務名稱
填寫代碼任務的名稱。例如,xlrd包測試。
調度類型
選擇手動任務。
選擇目錄
選擇代碼任務的目錄。
使用模板
預設不開啟。
Pyhton三方包
選擇步驟一中安裝成功的xlrd包。

描述
填寫對任務的簡單描述。例如,xlrd包測試。
單擊確定。
在Python任務代碼編寫頁面,選擇Python3.7版本並編寫代碼。本案例測試代碼如下:
說明dataphin.xls資源可以使用任意的.xls格式檔案上傳Dataphin資源後進行引用,資源名替換為建立上傳時填寫的資源名稱。更多資訊,請參見上傳資源及引用。@resource_reference{"dataphin.xls"} # 引用dataphin.xls資源 # 匯入xlrd模組。 import xlrd wb = xlrd.open_workbook('dataphince.xls') # 開啟excel sh = wb.sheet_by_name('Sheet1') # 按活頁簿定位工作表 # 遍曆excel,列印所有資料 for i in range(sh.nrows): print(sh.row_values(i))在代碼編寫頁面,儲存並提交SQL任務。
單擊頁面上的
表徵圖,運行代碼。單擊頁面右上方的
表徵圖,提交代碼。
在提交備忘頁面,填寫備忘資訊。
單擊確定並提交。