在執行任務前,可通過上傳所需的檔案、JAR包等資源,或負載檔案目錄至EMR Serverless Spark,以確保任務運行時可以無縫地訪問所需資源。
背景資訊
託管檔案目錄:通過介面直接上傳本地檔案到指定的儲存空間,並在任務運行時直接存取這些檔案。
納管檔案目錄:將OSS、NAS作為檔案系統掛載到Notebook會話資源、資料開發工作單位中,直接存取納管檔案目錄的檔案。
使用限制
在使用託管檔案目錄功能時,單次上傳的檔案大小不得超過 500MB。
單工作空間最多支援添加10個納管檔案目錄。
通過Livy Gateway、Kyuubi Gateway提交的任務暫不支援掛載納管檔案目錄。
託管檔案目錄
上傳檔案
進入資源上傳頁面。
在左側導覽列,選擇。
在Spark頁面,單擊目標工作空間的名稱。
在EMR Serverless Spark頁面,單擊左側導覽列中的文件管理。
在托管文件目录頁面,單擊上传文件。
在上传文件對話方塊中,單擊待上傳檔案地區選取項目本地檔案,或者直接拖拽目標檔案到待上傳檔案地區。
管理檔案及檔案夾
在托管文件目录頁面,您可以對已有的檔案及檔案夾進行以下操作:
檔案:
下载文件:將檔案下載到本地。
复制地址:擷取檔案的訪問路徑。
删除:刪除檔案。
檔案夾:您可以進行新建文件夹、重命名和删除操作。
納管檔案目錄
在添加納管檔案目錄後,具有工作空間檔案編輯許可權的成員可以通過檔案管理介面對納管OSS檔案目錄的檔案及檔案夾進行編輯;而擁有資料開發相關許可權的成員則可以通過資料開發工作單位進行檔案及檔案夾的讀寫操作。
新增檔案目錄
在纳管文件目录頁面,單擊新增文件目录。
在创建文件目录對話方塊中,配置以下資訊,單擊确定。
OSS
OSS配置參數如下。
參數
說明
檔案目錄名稱
檔案目錄的名稱。
OSS 路徑
選擇有許可權的OSS儲存路徑。需要確保工作空間執行角色具有訪問該路徑的許可權。
挂载路径
支援自訂修改,但必須位於
/mnt路徑下。通用型 NAS
通用型NAS配置參數如下。
參數
說明
檔案目錄名稱
檔案目錄的名稱。
檔案系統
選擇有許可權的通用型NAS。需要確保工作空間執行角色具有訪問該NAS的許可權。
掛載點
配置掛載點來訪問NAS檔案系統。
檔案系統路徑
配置NAS中已有的儲存路徑。不填寫時,預設掛載根目錄。
掛載路徑
支援自訂修改,但必須位於
/nas路徑下。
刪除檔案目錄
在刪除檔案目錄時,僅僅是解除工作空間檔案目錄與OSS、NAS之間的關聯關係,而並不會刪除該OSS、NAS下的檔案。
在纳管文件目录頁面,單擊操作列的刪除。
單擊确定。
後續操作
託管檔案目錄:在資源上傳完成後,您可以在後續的任務開發中將已上傳的檔案作為依賴項或輸入資料來源來調用。
納管檔案目錄:在完成納管後,您可以在後續的Notebook會話配置、資料開發工作單位配置中掛載納管檔案目錄。