全部產品
Search
文件中心

Platform For AI:MaxCompute表匯入OSS

更新時間:Jan 21, 2025

MaxCompute表匯入OSS組件主要用於將MaxCompute表匯入OSS。表中的每一行資料匯出為一個合法的JSON對象,匯出檔案(JSONL格式,樣本)由多行JSON對象組成,整個檔案本身不是合法的JSON對象。資料量大時可能會被切分為多個檔案。

支援的計算資源

MaxCompute

配置組件

在Designer工作流程頁面添加MaxCompute表匯入OSS組件,並在介面右側配置相關參數:

參數類型

參數

是否必選

描述

預設值

欄位設定

OSS儲存目錄

匯出資料的OSS儲存目錄,匯出資料可能會切分為多個檔案。

執行調優

每個執行個體的cpu數目

設定map task每個instance的CPU數目,取值範圍為[50,800]。

100

每個執行個體的memory大小,單位M

設定map task每個instance的memory大小,單位為MB,取值範圍為[256,12288]。

1024

每個執行個體處理的資料大小,單位M

設定map task每個instance的最大處理資料量,使用者可以通過控制該變數,實現對map端輸入的控制。單位為MB,取值範圍為[1,Integer.MAX_VALUE]。

256