全部產品
Search
文件中心

Platform For AI:CreateDataset - 建立資料集

更新時間:Apr 07, 2026

建立一個資料集。

調試

您可以在OpenAPI Explorer中直接運行該介面,免去您計算簽名的困擾。運行成功後,OpenAPI Explorer可以自動產生SDK程式碼範例。

調試

授權資訊

下表是API對應的授權資訊,可以在RAM權限原則語句的Action元素中使用,用來給RAM使用者或RAM角色授予調用此API的許可權。具體說明如下:

  • 操作:是指具體的許可權點。

  • 存取層級:是指每個操作的存取層級,取值為寫入(Write)、讀取(Read)或列出(List)。

  • 資源類型:是指操作中支援授權的資源類型。具體說明如下:

    • 對於必選的資源類型,用前面加 * 表示。

    • 對於不支援資源級授權的操作,用全部資源表示。

  • 條件關鍵字:是指雲產品自身定義的條件關鍵字。

  • 關聯操作:是指成功執行操作所需要的其他許可權。操作者必須同時具備關聯操作的許可權,操作才能成功。

操作

存取層級

資源類型

條件關鍵字

關聯操作

paidataset:CreateDataset

create

*全部資源

*

請求文法

POST /api/v1/datasets HTTP/1.1

請求參數

名稱

類型

必填

描述

樣本值

body

object

請求體。

Name

string

資料集的名稱。命名規則如下:

  • 以小寫字母、大寫字母、數字或中文開頭。

  • 可以包含底線(_)或短劃線(-)。

  • 長度為 1~127 個字元。

myName

Property

string

資料集的屬性。支援以下取值:

  • FILE:檔案。

  • DIRECTORY:檔案夾。

枚舉值:

  • DIRECTORY :

    DIRECTORY

  • FILE :

    FILE

DIRECTORY

DataSourceType

string

資料來源類型。支援以下取值:

  • OSS:阿里雲Object Storage Service。

  • NAS:阿里雲Apsara File Storage NAS通用型。

  • EXTREMENAS:阿里雲Apsara File Storage NAS極速型。

  • CPFS: 阿里雲檔案儲存體(CPFS)通用版。

  • BMCPFS:阿里雲檔案儲存體(CPFS)智算版。

  • MAXCOMPUTE:阿里雲雲原生MaxCompute(MaxCompute)。

  • URL:公網 HTTP/HTTPS 地址。

枚舉值:

  • NAS :

    NAS

  • MAXCOMPUTE :

    MAXCOMPUTE

  • CPFS :

    CPFS

  • BMCPFS :

    BMCPFS

  • EXTREMENAS :

    EXTREMENAS

  • OSS :

    OSS

  • URL :

    URL

NAS

Uri

string

Uri 配置範例如下:

  • 資料來源類型為 OSS:oss://bucket.endpoint/object

  • 資料來源類型為 NAS: 通用型 NAS 格式為:nas://<nasfisid>.region/subpath/to/dir/; CPFS1.0:nas://<cpfs-fsid>.region/subpath/to/dir/; CPFS2.0:nas://<cpfs-fsid>.region/<protocolserviceid>/。 CPFS1.0 和 CPFS2.0 根據 fsid 的格式來區分:CPFS1.0 格式為 cpfs-<8 位 ASCII 字元>;CPFS2.0 格式為 cpfs-<16 位 ASCII 字元>。

nas://09f****f2.cn-hangzhou/

DataType

string

資料集的資料類型,預設為 COMMON。支援以下取值:

  • COMMON:普通。

  • PIC:圖片。

  • TEXT:文本。

  • VIDEO:視頻。

  • AUDIO:音頻。

枚舉值:

  • VIDEO :

    VIDEO

  • COMMON :

    COMMON

  • TEXT :

    TEXT

  • PIC :

    PIC

  • AUDIO :

    AUDIO

COMMON

Labels

array

標籤列表。

Label

為資料集添加的標籤。

SourceType

string

資料來源類型,預設為 USER。

枚舉值:

  • PAI_PUBLIC_DATASET :

    PAI_PUBLIC_DATASET

  • ITAG :

    ITAG

  • USER :

    USER

USER

SourceId

string

資料來源 ID。

  • 當 SourceType 為 USER 時,SourceId 支援自訂。

  • 當 SourceType 為 ITAG 時,即 iTAG 模組標註結果產生的資料集時,SourceId 為 ITAG 的任務 ID。

  • 當 SourceType 為 PAI_PUBLIC_DATASET 時,即使用 PAI 公用資料集建立的資料集時,SourceId 預設為空白。

jdnhf***fnrimv

Description

string

對資料集進行自訂描述,以區分不同的資料集。

This is a description of the dataset.

WorkspaceId

string

資料集所在工作空間 ID。如何擷取工作空間 ID,請參見 ListWorkspaces 。 如果不配置該參數,則會使用預設工作空間;如果預設工作空間不存在,則會報錯。

478**

Options

string

擴充欄位,JsonString 類型。 當 DLC 使用資料集時,可通過配置 mountPath 欄位指定資料集預設掛載路徑。

{ "mountPath": "/mnt/data/" }

Accessibility

string

工作空間可見度。支援以下取值:

  • PRIVATE(預設值):表示工作空間內自己以及管理員可見。

  • PUBLIC:工作空間所有使用者可見。

  • ROLE_PUBLIC:指定工作空間角色可見,角色列表參考:AccessibleRoleIdList。該條件下資料集所有者及管理員始終具備可見度。

枚舉值:

  • PUBLIC :

    PUBLIC

  • PRIVATE :

    PRIVATE

PRIVATE

ProviderType

string

資料集的資料來源來源類型,支援配置的類型如下:

  • Ecs(預設值)

  • Lingjun

Ecs

Provider

string

資料集提供者。不允許設定為 pai。

Github

UserId

string

資料集所有者的阿里雲帳號 ID。工作空間所有者和管理員有許可權給指定工作空間成員建立資料集。

2485765****023475

SourceDatasetId

string

標註資料集的來來源資料集 ID。

d-bvfasdfxxxxj8o411

SourceDatasetVersion

string

標註資料集的來來源資料集版本。

v2

VersionDescription

string

資料集初始版本的描述。

This is a description of the first dataset version.

VersionLabels

array

初始版本標籤列表。

Label

為資料集初始版本添加的標籤。

DataSize

integer

資料集檔案佔據空間的大小。單位 Byte 。

10000

DataCount

integer

資料集檔案數量,單位個。

500

MountAccessReadWriteRoleIdList

array

指定該資料集被掛載時具有讀寫權限的工作空間角色名稱列表,PAI 開頭的為基礎角色 ID,role-開頭的為自訂角色 ID。如果列表中包含了"*",則表示對所有角色都有讀寫權限。

  • 指定角色下的帳號: ["PAI.AlgoOperator", "role-hiuwpd01ncrokkgp21"]

  • 全部帳號:["*"]

  • 指定為資料集建立者: []

string

工作空間角色 ID

PAI.AlgoOperator

ImportInfo

string

資料集的儲存匯入配置資訊,支援 OSS/NAS/CPFS 等。

OSS

{
"region": "${region}",//地區 ID
"bucket": "${bucket}",//bucket 名稱
"path": "${path}" //檔案路徑
}





NAS

{
"region": "${region}",//地區 ID
"fileSystemId": "${file_system_id}", //檔案系統 ID
"path": "${path}", //檔案系統路徑
"mountTarget": "${mount_target}" //檔案系統掛載點
}






CPFS

{
"region": "${region}",//地區 ID
"fileSystemId": "${file_system_id}", //檔案系統 ID
"protocolServiceId":"${protocol_service_id}", //檔案系統協議服務
"exportId": "${export_id}", //檔案系統匯出目錄
"path": "${path}", //檔案系統路徑
}







智算 CPFS

{
"region": "${region}",//地區 ID
"fileSystemId": "${file_system_id}", //檔案系統 ID
"path": "${path}", //檔案系統路徑
"mountTarget": "${mount_target}" //檔案系統掛載點,智算版特有
"isVpcMount": boolean, //是否為 vpc 掛載點, 智算版特有
}







{ "region": "cn-wulanchabu", "fileSystemId": "bmcpfs-xxxxxxxxxxx", "path": "/mnt", "mountTarget": "cpfs-xxxxxxxxxxxx-vpc-gacs9f.cn-wulanchabu.cpfs.aliyuncs.com", "isVpcMount": true }

Edition

string

資料集類型。預設為 BASIC,支援以下取值:

  • BASIC:基礎型。不支援資料集檔案中繼資料管理。

  • ADVANCED:進階型。僅 OSS 類型支援,每個版本支援最多 100 萬個檔案中繼資料管理。

  • LOGICAL:邏輯型。僅 OSS 類型支援,每個版本支援最多 300 萬個檔案中繼資料管理。

枚舉值:

  • LOGICAL :

    LOGICAL

  • BASIC :

    BASIC

  • ADVANCED :

    ADVANCED

ADVANCED

AccessibleRoleIdList

array

在 Accessibility 為 ROLE_PUBLIC 時生效。該資料集可見的工作空間角色名稱列表,PAI 開頭的為基礎角色 ID,role-開頭的為自訂角色 ID。

string

工作空間角色 ID。

PAI.AlgoOperator

返回參數

名稱

類型

描述

樣本值

object

返回體。

RequestId

string

請求 ID。

B2C51F93-1C07-5477-9705-5FDB****F19F

DatasetId

string

資料集 ID。

d-rbvg5*****jhc9ks92

樣本

正常返回樣本

JSON格式

{
  "RequestId": "B2C51F93-1C07-5477-9705-5FDB****F19F",
  "DatasetId": "d-rbvg5*****jhc9ks92"
}

錯誤碼

訪問錯誤中心查看更多錯誤碼。

變更歷史

更多資訊,參考變更詳情