全部產品
Search
文件中心

Platform For AI:OSS資料匯入MaxCompute表

更新時間:Jul 13, 2024

OSS資料匯入MaxCompute表組件主要用於將OSS中的資料匯入MaxCompute表。輸入為資料檔案所在的OSS目錄,預設會讀取該目錄下所有資料檔案。OSS中的資料檔案(JSONL格式,樣本)需要符合:每一行是一個合法的JSON對象,檔案由多行JSON對象組成,整個檔案本身不是合法的JSON對象。

支援的計算資源

MaxCompute

配置組件

在Designer工作流程頁面添加OSS資料匯入MaxCompute表組件,並在介面右側配置相關參數:

參數類型

參數

是否必選

描述

預設值

欄位設定

輸出表名稱

輸出表名稱。

執行調優

每個執行個體的cpu數目

設定map task每個instance的CPU數目,取值範圍為[50,800]。

100

每個執行個體的memory大小,單位M

設定map task每個instance的memory大小,單位為MB,取值範圍為[256,12288]。

1024

每個執行個體處理的資料大小,單位M

設定map task每個instance的最大處理資料量,使用者可以通過控制該變數,實現對map端輸入的控制。單位為MB,取值範圍為[1,Integer.MAX_VALUE]。

256