全部产品
Search
文档中心

Resource Orchestration Service:ALIYUN::PAI::Dataset

更新时间:Jun 26, 2025

ALIYUN::PAI::Dataset digunakan untuk membuat dataset.

Sintaks

{
  "Type": "ALIYUN::PAI::Dataset",
  "Properties": {
    "Options": String,
    "Description": String,
    "Accessibility": String,
    "DatasetName": String,
    "SourceType": String,
    "SourceId": String,
    "DataSourceType": String,
    "WorkspaceId": String,
    "DataType": String,
    "Uri": String,
    "Property": String
  }
}

Properti

Properti

Tipe

Diperlukan

Dapat Diedit

Deskripsi

Kendala

Options

String

Tidak

Ya

Bidang yang diperluas.

Ketika Anda menggunakan dataset dalam Deep Learning Containers (DLC), Anda dapat menggunakan bidang mountPath untuk menentukan jalur pemasangan default dari dataset. Contoh:

{ "mountPath": "/mnt/data/" }

Description

String

Tidak

Ya

Deskripsi dataset.

Dataset digunakan untuk skenario pelabelan.

Accessibility

String

Tidak

Ya

Aksesibilitas ruang kerja.

Nilai valid:

  • PRIVATE (default): Ruang kerja hanya dapat diakses oleh administrator dan Anda.

  • PUBLIC: Ruang kerja dapat diakses oleh semua pengguna.

DatasetName

String

Ya

Ya

Nama dataset.

Nama harus memenuhi persyaratan berikut:

  • Harus dimulai dengan huruf atau angka.  

  • Dapat mengandung garis bawah (_) dan tanda hubung (-).  

  • Harus memiliki panjang 1 hingga 127 karakter.  

SourceType

String

Tidak

Tidak

Jenis sumber data.

Nilai valid:

  • USER (default): Sumber data disediakan oleh Anda.

  • ITAG: Sumber data disediakan oleh iTAG.

  • PAI_PUBLIC_DATASETPAI: Sumber data disediakan oleh dataset publik dari Platform for AI (PAI).

SourceId

String

Tidak

Tidak

ID sumber data.

Nilai valid:

  • Tetapkan nilai properti ini ke ID kustom ketika SourceType diatur ke USER.

  • Tetapkan nilai properti ini ke ID pekerjaan ketika SourceType diatur ke ITAG. Pekerjaan merujuk pada pekerjaan pelabelan yang diproses iTAG berdasarkan dataset.  

  • Properti ini secara otomatis dibiarkan kosong ketika SourceType diatur ke PAI_PUBLIC_DATASET. Nilai PAI_PUBLIC_DATASET menentukan bahwa dataset dibuat dari dataset publik PAI.  

DataSourceType

String

Ya

Tidak

Layanan penyimpanan tempat sumber data disimpan.

Nilai valid:

  • NAS: File Storage NAS (NAS)

  • OSS: Object Storage Service (OSS)

WorkspaceId

String

Ya

Tidak

ID ruang kerja tempat dataset berada.

Tidak ada.

DataType

String

Tidak

Tidak

Jenis dataset.

Nilai valid:

  • COMMON (default): reguler

  • PIC: gambar

  • TEXT: teks

  • Video: video

  • AUDIO: audio

Uri

String

Ya

Tidak

Konfigurasi URI.

Format nilai:

  • Format nilai ketika DataSourceType diatur ke OSS: oss://bucket.endpoint/object

  • Format nilai ketika DataSourceType diatur ke NAS:

    • Format nilai untuk sistem file NAS tujuan umum: nas://<nasfisid>.region/subpath/to/dir/

    • Format nilai untuk sistem file Cloud Parallel File Storage (CPFS) 1.0:

      nas://<cpfs-fsid>.region/subpath/to/dir/

    • Format nilai untuk sistem file CPFS 2.0:

      nas://<cpfs-fsid>.region/<protocolserviceid>/

    Catatan

    Anda dapat membedakan sistem file CPFS 1.0 dan CPFS 2.0 berdasarkan format ID sistem file. ID sistem file CPFS 1.0 dalam format CPFS-<8-bit karakter ASCII>. ID sistem file CPFS 2.0 dalam format CPFS-<16-bit karakter ASCII>.

Property

String

Ya

Tidak

Properti dataset.

Nilai valid:

  • FILE: file

  • DIRECTORY: folder

Nilai Pengembalian

Fn::GetAtt

  • Options: bidang yang diperluas.

  • Description: deskripsi dataset.

  • Accessibility: aksesibilitas ruang kerja.

  • SourceId: ID sumber data.

  • CreateTime: waktu pembuatan dataset.

  • SourceType: jenis sumber data.

  • WorkspaceId: ID ruang kerja tempat dataset berada.

  • Uri: konfigurasi URI.

  • GmtModifiedTime: waktu pembaruan dataset.

  • DatasetId: ID dataset.

  • OwnerId: ID akun Alibaba Cloud.

  • DatasetName: nama dataset.

  • UserId: ID pengguna.

  • DataSourceType: layanan penyimpanan tempat sumber data disimpan.

  • DataType: jenis dataset.

  • Property: properti dataset.

Contoh

YAML format

ROSTemplateFormatVersion: '2015-09-01'
Parameters:
  DataSourceType:
    AllowedValues:
    - OSS
    - NAS
    Description: 'Jenis sumber data. Nilai berikut didukung:

      - OSS: Penyimpanan Objek Alibaba Cloud (OSS).

      - NAS: Penyimpanan file cloud Alibaba (NAS).'
    Type: String
  DatasetName:
    Description: 'Nama dataset. Aturan penamaan adalah sebagai berikut:

      - Dimulai dengan huruf kecil, huruf besar, angka, atau karakter Cina.

      - Dapat mengandung garis bawah (_) atau tanda hubung (-).

      - Panjangnya 1~127 karakter.'
    Type: String
  Property:
    AllowedValues:
    - FILE
    - DIRECTORY
    Description: 'Properti dataset. Nilai berikut didukung:

      - FILE: FILE.

      - DIRECTORY: folder.'
    Type: String
  Uri:
    Description: 'Contoh konfigurasi Uri adalah sebagai berikut:

      - Jenis sumber data adalah OSS:''oss:// bucket.endpoint/object''

      - Jenis sumber data adalah NAS:

      Format NAS umum adalah: ''nas://.region/subpath/to/dir/'';

      CPFS1.0:''nas://.region/subpath/to/dir /'';

      CPFS2.0:''nas://.region//''.

      CPFS1.0 dan CPFS2.0 dibedakan berdasarkan format fsid: CPFS1.0 adalah cpfs-<8-bit karakter ascii>;CPFS2.0 adalah cpfs-<16 karakter ascii>.'
    Type: String
  WorkspaceId:
    Description: 'ID ruang kerja tempat dataset berada. Untuk detail tentang cara mendapatkan ID ruang kerja, lihat [ListWorkspaces](~~ 449124 ~~).

      Jika parameter ini tidak dikonfigurasi, ruang kerja default digunakan. Jika ruang kerja default tidak ada, kesalahan dilaporkan.'
    Type: String
Resources:
  ExtensionResource:
    Properties:
      DataSourceType:
        Ref: DataSourceType
      DatasetName:
        Ref: DatasetName
      Property:
        Ref: Property
      Uri:
        Ref: Uri
      WorkspaceId:
        Ref: WorkspaceId
    Type: ALIYUN::PAI::Dataset
Outputs:
  Accessibility:
    Description: Visibilitas ruang kerja.
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - Accessibility
  CreateTime:
    Description: Waktu pembuatan sumber daya.
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - CreateTime
  DataSourceType:
    Description: Jenis sumber data.
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - DataSourceType
  DataType:
    Description: Jenis dataset. Nilai default adalah COMMON.
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - DataType
  DatasetId:
    Description: ID pertama sumber daya.
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - DatasetId
  DatasetName:
    Description: Nama dataset.
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - DatasetName
  Description:
    Description: Deskripsi kustom dataset untuk membedakan antara dataset yang berbeda.
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - Description
  GmtModifiedTime:
    Description: Waktu pembaruan.
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - GmtModifiedTime
  Options:
    Description: Bidang yang diperluas, yang bertipe JsonString.
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - Options
  OwnerId:
    Description: ID akun utama.
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - OwnerId
  Property:
    Description: Properti dataset.
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - Property
  SourceId:
    Description: ID sumber data.
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - SourceId
  SourceType:
    Description: Jenis sumber data. Nilai default adalah USER.
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - SourceType
  Uri:
    Description: Contoh konfigurasi Uri adalah sebagai berikut:.
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - Uri
  UserId:
    Description: ID pengguna yang memiliki dataset.
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - UserId
  WorkspaceId:
    Description: ID ruang kerja tempat dataset berada. Untuk detail tentang cara mendapatkan ID ruang kerja, lihat [ListWorkspaces](~~ 449124 ~~).
    Value:
      Fn::GetAtt:
      - ExtensionResource
      - WorkspaceId

JSON format

{
  "ROSTemplateFormatVersion": "2015-09-01",
  "Parameters": {
    "DataSourceType": {
      "AllowedValues": [
        "OSS",
        "NAS"
      ],
      "Description": "Jenis sumber data. Nilai berikut didukung:\n- OSS: Penyimpanan Objek Alibaba Cloud (OSS).\n- NAS: Penyimpanan file cloud Alibaba (NAS).",
      "Type": "String"
    },
    "DatasetName": {
      "Description": "Nama dataset. Aturan penamaan adalah sebagai berikut:\n- Dimulai dengan huruf kecil, huruf besar, angka, atau karakter Cina.\n- Dapat mengandung garis bawah (_) atau tanda hubung (-).\n- Panjangnya 1~127 karakter.",
      "Type": "String"
    },
    "Property": {
      "AllowedValues": [
        "FILE",
        "DIRECTORY"
      ],
      "Description": "Properti dataset. Nilai berikut didukung:\n- FILE: FILE.\n- DIRECTORY: folder.",
      "Type": "String"
    },
    "Uri": {
      "Description": "Contoh konfigurasi Uri adalah sebagai berikut:\n- Jenis sumber data adalah OSS:'oss:// bucket.endpoint/object'\n- Jenis sumber data adalah NAS:\nFormat NAS umum adalah: 'nas://.region/subpath/to/dir/';\nCPFS1.0:'nas://.region/subpath/to/dir /';\nCPFS2.0:'nas://.region//'.\nCPFS1.0 dan CPFS2.0 dibedakan berdasarkan format fsid: CPFS1.0 adalah cpfs-<8-bit karakter ascii>;CPFS2.0 adalah cpfs-<16 karakter ascii>.",
      "Type": "String"
    },
    "WorkspaceId": {
      "Description": "ID ruang kerja tempat dataset berada. Untuk detail tentang cara mendapatkan ID ruang kerja, lihat [ListWorkspaces](~~ 449124 ~~).\nJika parameter ini tidak dikonfigurasi, ruang kerja default digunakan. Jika ruang kerja default tidak ada, kesalahan dilaporkan.",
      "Type": "String"
    }
  },
  "Resources": {
    "ExtensionResource": {
      "Properties": {
        "DataSourceType": {
          "Ref": "DataSourceType"
        },
        "DatasetName": {
          "Ref": "DatasetName"
        },
        "Property": {
          "Ref": "Property"
        },
        "Uri": {
          "Ref": "Uri"
        },
        "WorkspaceId": {
          "Ref": "WorkspaceId"
        }
      },
      "Type": "ALIYUN::PAI::Dataset"
    }
  },
  "Outputs": {
    "Accessibility": {
      "Description": "Visibilitas ruang kerja.",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "Accessibility"
        ]
      }
    },
    "CreateTime": {
      "Description": "Waktu pembuatan sumber daya.",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "CreateTime"
        ]
      }
    },
    "DataSourceType": {
      "Description": "Jenis sumber data.",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "DataSourceType"
        ]
      }
    },
    "DataType": {
      "Description": "Jenis dataset. Nilai default adalah COMMON.",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "DataType"
        ]
      }
    },
    "DatasetId": {
      "Description": "ID pertama sumber daya.",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "DatasetId"
        ]
      }
    },
    "DatasetName": {
      "Description": "Nama dataset.",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "DatasetName"
        ]
      }
    },
    "Description": {
      "Description": "Deskripsi kustom dataset untuk membedakan antara dataset yang berbeda.",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "Description"
        ]
      }
    },
    "GmtModifiedTime": {
      "Description": "Waktu pembaruan.",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "GmtModifiedTime"
        ]
      }
    },
    "Options": {
      "Description": "Bidang yang diperluas, yang bertipe JsonString.",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "Options"
        ]
      }
    },
    "OwnerId": {
      "Description": "ID akun utama.",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "OwnerId"
        ]
      }
    },
    "Property": {
      "Description": "Properti dataset.",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "Property"
        ]
      }
    },
    "SourceId": {
      "Description": "ID sumber data.",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "SourceId"
        ]
      }
    },
    "SourceType": {
      "Description": "Jenis sumber data. Nilai default adalah USER.",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "SourceType"
        ]
      }
    },
    "Uri": {
      "Description": "Contoh konfigurasi Uri adalah sebagai berikut:.",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "Uri"
        ]
      }
    },
    "UserId": {
      "Description": "ID pengguna yang memiliki dataset.",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "UserId"
        ]
      }
    },
    "WorkspaceId": {
      "Description": "ID ruang kerja tempat dataset berada. Untuk detail tentang cara mendapatkan ID ruang kerja, lihat [ListWorkspaces](~~ 449124 ~~).",
      "Value": {
        "Fn::GetAtt": [
          "ExtensionResource",
          "WorkspaceId"
        ]
      }
    }
  }
}