全部产品
Search
文档中心

Elastic Container Instance:Buat dan kelola DataCache

更新时间:Jul 06, 2025

Setelah menerapkan CRD DataCache (definisi sumber daya kustom), Anda dapat membuat DataCache untuk menarik data yang diperlukan oleh bisnis Anda, seperti model pelatihan AI. Topik ini menjelaskan parameter yang diperlukan untuk membuat DataCache serta cara menanyakan dan menghapusnya.

Prasyarat

CRD DataCache telah diterapkan di kluster. Untuk informasi lebih lanjut, lihat Terapkan CRD DataCache.

Buat DataCache

Deskripsi konfigurasi

Kode berikut menyediakan parameter dalam file konfigurasi YAML dari DataCache:

apiVersion: eci.aliyun.com/v1alpha1
kind: DataCache
metadata:
  name: test-url
spec:
  bucket: default
  path: /demo/url
  size: 20
  retentionDays: 3
  dataSource:
    type: URL 
    options:
      url: https://www.example.com
  netConfig: 
    securityGroupId: sg-2ze63v3jtm8e6sy******
    vSwitchId: vsw-2ze94pjtfuj9vaym******

Deskripsi parameter:

  • apiVersion: Versi API. Atur nilainya menjadi eci.aliyun.com/v1alpha1.

  • kind: Jenis sumber daya. Atur nilainya menjadi DataCache.

  • metadata

    • name: Nama DataCache.

  • spec

    • bucket: Nama bucket untuk menyimpan DataCache. Nilai default: default. Anda juga dapat menentukan nilai lain. Bucket bernama eci-system dicadangkan untuk menyimpan cache umum Elastic Container Instance dan tidak dapat digunakan sebagai nilai parameter ini.

    • path: Jalur tempat data disimpan.

    • size: Ukuran DataCache. Satuan: GiB. Nilai default: 20. Evaluasi ukuran yang diperlukan berdasarkan ukuran data aktual.

    • retentionDays: Jumlah hari retensi DataCache. Ketika masa retensi berakhir, DataCache akan dihapus. Secara default, DataCache tidak memiliki tanggal kedaluwarsa.

    • dataSource: Sumber data. Tabel berikut menjelaskan parameter type dari sumber data dan parameter options untuk setiap tipe.

      type

      Deskripsi

      options

      URL

      Alamat hyperlink

      • url: URL tempat data diunduh.

      • accessToken: token yang digunakan untuk otentikasi sebelum Anda menarik data pribadi.

      HuggingFace atau ModelScope

      • repoSource: menarik model atau dataset dari komunitas ModelScope atau HuggingFace. Nilai valid: ModelScope/Model, ModelScope/DataSet, HuggingFace/Model, dan HuggingFace/DataSet.

      • repoId: ID model atau dataset.

      • revision: versi. Nilai default: main atau master.

      • accessToken: token yang digunakan untuk otentikasi sebelum Anda menarik data pribadi.

      NAS

      Sistem file NAS (File Storage NAS)

      • server: titik mount sistem file NAS.

      • path: subdirektori sistem file NAS. Untuk sistem file NAS ekstrem, awali /share ke jalur. Contoh: /share/path.

      • vers: nomor versi protokol NFS (Network File System) berdasarkan sistem file NAS dipasang. Kami merekomendasikan Anda menggunakan NFS v3. NAS ekstrem hanya mendukung NFS v3.

      • options: parameter yang digunakan saat Anda menetapkan parameter tipe ke NAS. Kami merekomendasikan Anda menggunakan parameter yang direkomendasikan dalam layanan NAS. Contoh: nolock,tcp,noresvport.

      OSS

      Bucket Object Storage Service (OSS)

      • bucket: nama bucket OSS.

      • url: titik akhir bucket OSS.

      • path: subdirektori bucket OSS. Jalur relatif terhadap direktori root bucket OSS. Nilai default: /.

      • otherOpts: Opsi kustom yang ditentukan untuk memasang bucket OSS. Format: -o *** -o ***. Contoh: -o max_stat_cache_size=0 -o allow_other.

      • ramRole: Peran RAM (Resource Access Management) yang digunakan jika Anda menggunakan RAM untuk memberikan izin.

        Catatan

        Buat peran RAM dan berikan peran RAM izin untuk mengakses bucket OSS. Untuk informasi lebih lanjut, lihat Buat peran RAM untuk layanan tepercaya Alibaba Cloud dan Berikan izin kepada peran RAM.

        Saat Anda membuat peran RAM, pilih Alibaba Cloud Service untuk parameter Pilih Entitas Tepercaya, Normal Service Role untuk parameter Jenis Peran, dan Elastic Compute Service untuk parameter Pilih Layanan Tepercaya. Saat Anda memberikan izin kepada peran RAM, lampirkan kebijakan AliyunOSSFullAccess ke peran RAM.

      • akId: ID AccessKey yang digunakan jika Anda menggunakan pasangan AccessKey untuk memberikan izin. Untuk informasi lebih lanjut, lihat Dapatkan pasangan AccessKey.

      • akSecret: Rahasia AccessKey yang digunakan jika Anda menggunakan pasangan AccessKey untuk memberikan izin. Untuk informasi lebih lanjut, lihat Dapatkan pasangan AccessKey.

      SNAPSHOT

      Snapshot

      snapshotId: ID snapshot.

    • netConfig

      • securityGroupId: ID grup keamanan tempat instance kontainer elastis yang dihasilkan termasuk.

      • vSwitchId: ID vSwitch tempat instance kontainer elastis yang dihasilkan terhubung.

      Jika Anda ingin menarik data melalui Internet, Anda dapat mengaitkan alamat IP elastis (EIP) dengan instance kontainer elastis jika vSwitch tidak dikonfigurasi dengan gateway SNAT (Source NAT). Dalam hal ini, Anda dapat menambahkan parameter EIP terkait di bagian netConfig.

      netConfig: 
        eipInstanceId: eip-2zey74a7zienoxf*****  # Tentukan eipInstanceId atau eipCreateParam.
        eipCreateParam:  # Tentukan eipInstanceId atau eipCreateParam.
          bandwidth: 5
          commonBandwidthPackage:  cbwp-2zeukbj916scmj5******
          internetChargeType:  PayByTraffic
          publicIpAddressPoolId: pippool-bp187arfugi543y1s****
          ISP: BGP
      • eipInstanceId: ID EIP. Jika vSwitch yang ditentukan tidak dikonfigurasi dengan gateway SNAT, Anda dapat mengaitkan EIP yang ada dengan instance kontainer elastis untuk menarik data melalui Internet.

      • eipCreateParam: Jika vSwitch yang ditentukan tidak dikonfigurasi dengan gateway SNAT dan tidak ada EIP yang ada, Anda dapat mengonfigurasi parameter berikut untuk membuat EIP dan mengaitkan EIP dengan instance kontainer elastis. Dengan cara ini, Anda dapat menarik data melalui Internet.

        • bandwidth: Bandwidth EIP. Satuan: Mbit/s. Nilai default: 5.

        • commonBandwidthPackage: Rencana bandwidth EIP yang ada yang terikat pada EIP. Untuk informasi lebih lanjut, lihat Apa itu Bandwidth Internet Bersama?

        • internetChargeType: Metode pengukuran EIP. Nilai valid: PayByBandwidth (bayar berdasarkan bandwidth) dan PayByTraffic (bayar berdasarkan transfer data). Untuk informasi lebih lanjut, lihat bagian "Metode pengukuran" dari topik Ikhtisar Penagihan.

        • publicIpAddressPoolId: ID kolam alamat IP publik. EIP dialokasikan dari kolam alamat IP. Anda tidak dapat menggunakan fitur kolam alamat IP secara default. Untuk menggunakan fitur ini, Anda harus mengajukan hak istimewa di konsol Quota Center. Untuk informasi lebih lanjut, lihat Buat dan kelola kolam alamat IP.

        • ISP: Tipe jalur EIP. Nilai valid: BGP dan BGP_PRO. Nilai default: BGP. Untuk informasi lebih lanjut, lihat bagian "Tipe jalur" dari topik Apa itu EIP.

Contoh konfigurasi

Tulis file konfigurasi YAML dan jalankan perintah kubectl untuk membuat DataCache. Anggaplah file konfigurasi YAML bernama datacache.yaml.

  • Buat DataCache baru.

    kubectl create -f datacache.yaml
  • Perbarui DataCache.

    kubectl apply -f datacache.yaml

File konfigurasi YAML dari DataCache:

URL

  • Tarik data dari URL.

    apiVersion: eci.aliyun.com/v1alpha1
    kind: DataCache
    metadata:
      name: test-url-1
    spec:
      path: /demo/url
      dataSource:
        type: URL 
        options:
          url: https://www.example.com
      netConfig:                
        securityGroupId: sg-2ze63v3jtm8e6sy******
        vSwitchId: vsw-2ze94pjtfuj9vaym******

  • Tarik model dari HuggingFace.

    apiVersion: eci.aliyun.com/v1alpha1
    kind: DataCache
    metadata:
      name: test-url-2
    spec:
      path: /demo/url
      dataSource:
        type: URL 
        options:
          repoSource: "HuggingFace/Model"        
          repoId: "decapoda-research/llama-7b-hf"
      netConfig: 
        securityGroupId: sg-2ze63v3jtm8e6sy******
        vSwitchId: vsw-2ze94pjtfuj9vaym******

NAS

apiVersion: eci.aliyun.com/v1alpha1
kind: DataCache
metadata:
  name: test-nas
spec:
  path: /demo/nas
  dataSource:
    type: NAS 
    options:
      server: "0389a***-nh**.cn-beijing.extreme.nas.aliyuncs.com"
      path: "/"
      vers: "3"
      options: "nolock,tcp,noresvport"
  netConfig: 
    securityGroupId: sg-2ze63v3jtm8e6sy******
    vSwitchId: vsw-2ze94pjtfuj9vaym******

OSS

apiVersion: eci.aliyun.com/v1alpha1
kind: DataCache
metadata:
  name: test-oss
spec:
  path: /demo/oss
  dataSource:
    type: OSS 
    options:
      bucket: "oss-***"
      url: "oss-cn-beijing-internal.aliyuncs.com"
      path: "/test"
      otherOpts: "-o max_stat_cache_size=0 -o allow_other"
      ramRole: "<your RAM Role Name>"
  netConfig: 
    securityGroupId: sg-2ze63v3jtm8e6sy******
    vSwitchId: vsw-2ze94pjtfuj9vaym******

SNAPSHOT

apiVersion: eci.aliyun.com/v1alpha1
kind: DataCache
metadata:
  name: test-snapshot
spec:
  path: /demo/snapshot
  dataSource:
    type: SNAPSHOT 
    options:
      snapshotId: s-uf6j98q2tvfcjz******
  netConfig: 
    securityGroupId: sg-2ze63v3jtm8e6sy******
    vSwitchId: vsw-2ze94pjtfuj9vaym***

Kelola DataCache

Catatan

Saat menanyakan atau menghapus DataCache, Anda dapat menggunakan salah satu nama berikut sebagai nama tipe sumber daya:

  • edc

  • datacache

  • datacaches

  • datacaches.eci.aliyun.com

Query a DataCache

Setelah membuat DataCache, Anda dapat menanyakan semua DataCache di kluster atau melihat detail DataCache.

  • Tanyakan semua DataCache di kluster.

    kubectl get edc 

    Contoh berikut menunjukkan output. Status Available menunjukkan bahwa DataCache siap digunakan.

    get edc.png

  • Lihat detail DataCache.

    kubectl describe edc <edc-name>

    Output berikut menunjukkan informasi dasar, metadata, konfigurasi, status, dan informasi acara dari DataCache.

    describe edc.png

Hapus DataCache

Penting

Setiap DataCache sesuai dengan snapshot. Untuk mempertahankan snapshot, Anda harus membayar penyimpanan snapshot. Kami merekomendasikan Anda menghapus DataCache yang tidak lagi Anda gunakan.

Jika Anda ingin menghapus DataCache, jalankan perintah berikut:

kubectl delete edc <edc-name>