全部产品
Search
文档中心

Platform For AI:FAQ EAS

更新时间:Dec 24, 2025

Topik ini menjawab pertanyaan umum (FAQ) mengenai layanan prediksi online.

Penerapan layanan dan status abnormal

Setelah menerapkan layanan, Anda dapat melihat status, log, dan event instans layanan di daftar Service Instances pada halaman Overview untuk mengidentifikasi masalah.

T: Layanan tetap berada dalam status Waiting dalam waktu lama. Bagaimana cara mengatasinya?

Setelah penerapan, layanan memasuki status Waiting sambil menunggu penjadwalan sumber daya dan startup instans layanan. Ketika semua instans layanan berhasil dimulai, layanan akan berpindah ke status Running. Kemungkinan penyebabnya sebagai berikut:

1. Sumber daya tidak mencukupi: Beberapa atau seluruh instans dalam daftar instans layanan berada dalam status Pending.

Masalah ini biasanya terjadi karena kelompok sumber daya khusus tidak memiliki cukup sumber daya idle, sehingga instans tidak dapat dijadwalkan. Gambar berikut menunjukkan contohnya:8da00c3a5f2ebf7f0a110686ae473103

Dalam kasus ini, periksa apakah node mesin dalam kelompok sumber daya khusus memiliki cukup sumber daya idle, termasuk CPU, Memory, dan GPU. Jika sebuah instans memerlukan 3 core CPU dan 4 GB memori, setidaknya satu node mesin dalam kelompok sumber daya khusus harus memiliki minimal 3 core CPU idle dan 4 GB memori idle.

Penting

Untuk mencegah kegagalan sistem selama periode beban tinggi, setiap node mesin menyisihkan satu core CPU untuk komponen sistem. Sumber daya yang dapat dijadwalkan adalah total sumber daya node dikurangi core yang disisihkan tersebut.

Gambar berikut menunjukkan daftar node dari kelompok sumber daya khusus. Untuk informasi lebih lanjut tentang cara melihat detail kelompok sumber daya, lihat Menggunakan kelompok sumber daya EAS.image

2. Pemeriksaan kesehatan instans belum lengkap: Instans layanan berada dalam status Running, tetapi status kontainer adalah [0/1] atau [1/2].

Angka sebelum garis miring (/) menunjukkan jumlah kontainer yang berhasil dimulai. Angka setelah garis miring (/) menunjukkan jumlah total kontainer. Saat Anda menerapkan layanan menggunakan custom image, sebuah kontainer sidecar secara otomatis disuntikkan ke dalam instans untuk tugas seperti shaping trafik dan pengumpulan data pemantauan. Anda tidak perlu mengelola kontainer ini. Di konsol, jumlah total kontainer adalah 2, yang mencakup kontainer kustom Anda dan kontainer sidecar dari engine. Dalam kasus ini, instans layanan hanya dapat menerima trafik setelah kedua kontainer berada dalam status Ready.ab1dfe90bbf7d3056c52b2dfbea196ce

3. Pemeriksaan kesehatan instans gagal: Port yang dikonfigurasi untuk layanan EAS tidak sesuai dengan port yang ditetapkan dalam kode.

Deskripsi masalah: Sebuah layanan EAS diterapkan menggunakan framework web seperti Flask, FastAPI, Sanic, atau Django untuk menyediakan API. Log menampilkan Running on http://127.0.0.1:7000:

image

Namun, konsol PAI menunjukkan bahwa layanan EAS masih berada dalam status Waiting:

image

Penyebab: Pemeriksaan kesehatan worker layanan EAS gagal. EAS mengharapkan layanan diekspos pada port 8089, tetapi aplikasi Flask menyediakan layanan pada port 7000.

image

Solusi: Ubah nomor port yang dikonfigurasi untuk layanan EAS agar sesuai dengan port dalam kode, lalu restart layanan.image

T: Layanan berada dalam status Failed. Bagaimana cara mengatasinya?

Layanan memasuki status Failed dalam dua skenario berikut:

  • Saat penerapan layanan: Jika sumber daya tertentu, seperti path model, tidak ada, penerapan akan gagal. Penyebab kesalahan ditampilkan dalam informasi status layanan, yang dapat Anda gunakan untuk mengidentifikasi alasan kegagalan tersebut.

  • Saat startup layanan: Layanan gagal dimulai setelah diterapkan dan dijadwalkan ke sumber daya. Dalam kasus ini, muncul pesan status Instance <network-test-5ff76448fd-h9dsn> not healthy: Instance crashed, please inspect instance log.

    Pesan status ini menunjukkan bahwa instans layanan gagal dimulai. Anda harus memeriksa status instans yang gagal di daftar Service Instances pada halaman Overview layanan untuk menentukan penyebab spesifiknya. Berikut adalah kemungkinan penyebab kegagalan instans:

    • Instans layanan dihentikan oleh sistem karena error out-of-memory (OOM) saat startup. Dalam kasus ini, Anda harus menambah memori yang dialokasikan untuk layanan dan menerapkan ulang layanan tersebut. Gambar berikut menunjukkan status instans:5c694af1e97b7d3c11cea6d6303d1540

    • Layanan mungkin crash karena kesalahan kode saat startup. Jika hal ini terjadi, Last Status akan menjadi Error dan kode kesalahan akan ditampilkan. Klik tombol Log di kolom Actions untuk instans tersebut guna memeriksa log layanan dan mengidentifikasi penyebab kegagalannya. Gambar berikut menunjukkan status instans:93d610794f407ebfc40a862fe47a9069

    • Gambar layanan gagal ditarik. Untuk informasi lebih lanjut, lihat T: Apa yang harus saya lakukan jika gambar gagal ditarik (ImagePullBackOff)?.

T: Apa yang harus saya lakukan jika gambar gagal ditarik (ImagePullBackOff)?

Jika Anda melihat ImagePullBackOff sebagai Last Exit Reason di daftar instans layanan, kemungkinan besar proses penarikan gambar gagal. Jika ikon berikut muncul di kolom Status, Anda dapat mengkliknya untuk melihat penyebab spesifiknya.

image

Penyebab umum kegagalan penarikan gambar meliputi:

Penyebab kegagalan

Kemungkinan error

Solusi

Disk space sistem tidak mencukupi

no space left on device

Perluas sistem disk.

Kontrol akses ACR tidak dikonfigurasi

no such host

Jika Anda menggunakan titik akhir publik gambar, Anda perlu mengaktifkan akses publik untuk ACR.

Jika Anda menggunakan titik akhir internal gambar:

  1. Tambahkan VPC, seperti eas_vpc, untuk EAS.

  2. Dalam pengaturan kontrol akses instans ACR Edisi Perusahaan, tambahkan eas_vpc. Untuk informasi lebih lanjut, lihat Mengonfigurasi kontrol akses untuk VPC pada ACR.

Masalah konfigurasi jaringan EAS

dial tcp ***** timeout

Jika Anda menggunakan titik akhir publik gambar, Anda perlu mengonfigurasi akses Internet untuk EAS.

Informasi autentikasi tidak tersedia atau salah

  • 401 Unauthorized

  • authorization failed

Jika instans ACR Edisi Perusahaan tidak dikonfigurasi untuk pull anonim publik dan Anda menarik gambar dari wilayah lain melalui Internet, Anda harus mengonfigurasi username dan password untuk repository gambar selama penerapan. Untuk informasi lebih lanjut tentang cara mendapatkan kredensial, lihat Mengonfigurasi kredensial akses.

Ikuti rekomendasi berikut berdasarkan wilayah repository gambar dan layanan EAS Anda:

  • Wilayah sama: Gunakan URL internal untuk menarik gambar.

  • Wilayah berbeda: Untuk ACR Edisi Personal, Anda harus menggunakan URL gambar publik. Untuk ACR Edisi Perusahaan, pilih salah satu opsi berikut:

    • Jika Anda memiliki persyaratan tinggi terhadap keamanan dan stabilitas, gunakan URL gambar internal. Anda harus menghubungkan VPC menggunakan Cloud Enterprise Network (CEN). Untuk informasi lebih lanjut, lihat Mengakses instans ACR Edisi Perusahaan dari wilayah berbeda atau IDC.

    • Jika skenario bisnis Anda sederhana atau Anda tidak dapat segera menghubungkan jaringan internal, gunakan URL gambar publik sebagai solusi sementara. Perlu diingat bahwa unduhan melalui Internet lebih lambat.

Perhatikan hal berikut mengenai instans ACR Edisi Perusahaan:

  • Konfigurasikan kontrol akses untuk VPC dan Internet sesuai kebutuhan.

  • Jika repository tidak mengizinkan pull gambar anonim, Anda harus menyediakan username dan password untuk repository gambar di EAS saat menarik gambar dari wilayah berbeda melalui Internet.

T: Layanan EAS secara otomatis restart setelah dihentikan

Deskripsi masalah: Layanan EAS secara otomatis restart beberapa waktu setelah dihentikan.

Penyebab:

Hal ini terjadi karena Auto Scaling dikonfigurasi untuk layanan tersebut, dan jumlah minimum instans diatur ke 0. Setelah periode tanpa trafik, jumlah instans secara otomatis diskalakan menjadi 0. Jika permintaan tiba saat tidak ada instans yang tersedia, skala keluar secara otomatis dipicu, bahkan jika ambang batas metrik skala keluar yang dikonfigurasi belum tercapai.

Anda dapat menentukan apakah skala keluar dipicu secara otomatis berdasarkan deskripsi penskalaan otomatis dalam event penerapan.

Solusi:

  • Jika Anda tidak lagi memerlukan layanan tersebut, Anda dapat menghapusnya.

  • Jika Anda tidak ingin menghapus layanan tersebut, Anda dapat menghentikannya secara manual dengan mengklik Stop di konsol atau dengan memanggil operasi API StopService. Layanan yang dihentikan secara manual tidak akan secara otomatis diskalakan keluar oleh trafik masuk.

  • Jika Anda tidak ingin layanan dihentikan secara otomatis karena skalabilitas elastis, jangan atur jumlah minimum instans ke 0.

  • Anda juga dapat menonaktifkan Auto Scaling sesuai kebutuhan untuk mencegah trafik tak terduga memicu skala keluar.

T: Error startup PAI-EAS: IoError(Os { code: 28, kind: StorageFull, message: "No space left on device" })

Deskripsi masalah:

PAI-EAS melaporkan error berikut saat startup:

[2024-10-21 20:59:33] serialize_file(_flatten(tensors), filename, metadata=metadata)

[2024-10-21 20:59:33] safetensors_rust.SafetensorError: Error while serializing: IoError(Os { code: 28, kind: StorageFull, message: "No space left on device" })

[2024-10-21 20:59:35] time="2024-10-21T12:59:35Z" level=info msg="program stopped with status:exit status 1" program=/bin/sh

Penyebab: Disk sistem instans EAS penuh karena berisi terlalu banyak file model, sehingga layanan tidak dapat dimulai dengan benar.

Solusi:

Solusi 1: Perluas disk sistem untuk instans EAS.

Solusi 2: Jika file model terlalu besar, simpan di penyimpanan eksternal seperti OSS atau NAS, dan baca menggunakan storage mounts.

T: Error penerapan: fail to start program with error: fork/exec /bin/sh: exec format error

exec format error menunjukkan bahwa sistem operasi tidak dapat mengeksekusi file program target. Penyebab paling umum adalah arsitektur CPU dari file yang dapat dieksekusi atau gambar kontainer tidak kompatibel dengan arsitektur sistem host.

Anda dapat mencoba beralih ke spesifikasi sumber daya yang berbeda.

T: Error: Invalid GPU count 6, only supported: [0 1 2 4 8 16]

Untuk memaksimalkan efisiensi komunikasi antara beberapa GPU, jumlah GPU yang ditentukan untuk satu instans layanan harus merupakan pangkat dari 2.

Anda dapat mengalokasikan 0, 1, 2, 4, 8, atau 16 GPU.

Masalah sumber daya

Penggunaan dan batas sumber daya

T: Mengapa saya tidak dapat memilih konfigurasi sumber daya 1-core, 2 GB saat menerapkan layanan EAS?

Untuk mencegah masalah, spesifikasi sumber daya 1-core, 2 GB tidak lagi tersedia. EAS menerapkan komponen sistem pada setiap node mesin, dan komponen ini mengonsumsi sebagian sumber daya mesin. Jika spesifikasi mesin terlalu kecil, proporsi sumber daya yang ditempati oleh komponen sistem terlalu tinggi, sehingga mengurangi proporsi sumber daya yang tersedia untuk layanan Anda.

T: Berapa jumlah maksimum layanan yang dapat diterapkan di EAS?

Jumlah maksimum instans layanan yang dapat Anda terapkan di EAS bergantung pada sumber daya yang tersedia. Anda dapat melihat penggunaan sumber daya di daftar mesin kelompok sumber daya di konsol. Untuk informasi lebih lanjut, lihat Menggunakan kelompok sumber daya EAS.

Jika Anda mengalokasikan instans berdasarkan jumlah core CPU, jumlah maksimum instans yang dapat Anda terapkan adalah (Jumlah total core CPU pada node - 1) / Jumlah core yang digunakan setiap instans.

T: Spesifikasi EAS apa yang memiliki daya komputasi mirip dengan kartu grafis 4090?

Spesifikasi ecs.gn8ia-2x.8xlarge memiliki performa mirip dengan kartu grafis 4090.

T: Berapa konkurensi maksimum untuk model yang diterapkan dengan konfigurasi sumber daya tertentu?

Konkurensi maksimum layanan model bergantung pada berbagai faktor, seperti model, skenario, dan konfigurasi sumber daya. Untuk informasi lebih lanjut, lihat Uji stres otomatis.

Manajemen kelompok sumber daya khusus

T: Kelompok sumber daya khusus terus-menerus melakukan scale-out

Hal ini biasanya terjadi karena sumber daya tidak mencukupi di wilayah saat ini. Untuk instans mesin berbasis langganan, jika pembuatan gagal karena sumber daya tidak mencukupi, sistem secara otomatis membuat pesanan pengembalian dana. Jumlah yang telah dibayar dikembalikan ke akun Anda.

T: Bagaimana cara menghapus instans langganan dari kelompok sumber daya khusus?

Buka halaman Pembatalan Langganan Alibaba Cloud untuk membatalkan langganan mesin khusus EAS berbasis langganan yang tidak digunakan. Di halaman tersebut, lakukan langkah-langkah berikut:

  • Atur Type ke Partial Refund.

  • Atur Product Name ke EAS Dedicated Machine Subscription.

Klik Search untuk menemukan sumber daya yang ingin Anda batalkan langganannya. Lalu, klik Unsubscribe Resource di kolom Actions dan ikuti petunjuk di konsol untuk menyelesaikan proses tersebut.

T: Apakah data instans layanan akan disimpan setelah saya membatalkan langganan mesin kelompok sumber daya EAS?

Tidak, data instans layanan tidak disimpan.

Manajemen disk sistem

T: Bagaimana cara memperluas disk sistem?

Anda dapat mengonfigurasi atau memperluas disk sistem untuk layanan dengan salah satu dari dua cara berikut:

  1. Konfigurasi konsol: Saat membuat atau memperbarui layanan, buka Resource Information > Configure System Disk, lalu atur ukuran System Disk.image

  2. Konfigurasi JSON: Dalam file konfigurasi JSON layanan, ubah nilai disk di bawah field metadata.

    "metadata": {"disk": "40Gi"}
Catatan

Jika Anda menggunakan kelompok sumber daya khusus, ukuran disk sistem yang dikonfigurasi tidak boleh melebihi ukuran disk sistem node tersebut. Jika Anda memerlukan disk sistem yang lebih besar, Anda harus melepaskan node saat ini dan membeli node baru dengan spesifikasi disk sistem yang lebih besar.

Pembaruan dan penskalaan layanan

T: Apa saja kebijakan penskalaan untuk EAS?

Anda dapat memilih kebijakan penskalaan berdasarkan kebutuhan bisnis Anda: horizontal auto-scaling atau scheduled scaling.

Jika Anda memilih horizontal auto-scaling, Anda dapat mengonfigurasinya berdasarkan metrik kustom, seperti queries per second (QPS) atau utilisasi CPU. Untuk informasi tentang cara menghitung dan mengonfigurasi metrik ini, lihat Horizontal auto-scaling.

Untuk mencegah penskalaan yang sering akibat fluktuasi metrik, sistem menerapkan rentang toleransi 10% terhadap ambang batas. Misalnya, jika Anda mengatur ambang batas QPS ke 10, skala keluar biasanya hanya dipicu ketika QPS secara konsisten di atas 11 (10 × 1,1). Artinya:

  • Jika QPS sempat berfluktuasi antara 10 dan 11, sistem mungkin tidak langsung melakukan skala keluar.

  • Skala keluar hanya dipicu ketika QPS secara konsisten stabil pada 11 hingga 12 atau lebih tinggi.

Mekanisme ini membantu mengurangi perubahan sumber daya yang tidak perlu, meningkatkan stabilitas sistem dan efisiensi biaya.

T: Di mana instans yang diskalakan keluar ditempatkan?

Jika Anda menggunakan kelompok sumber daya khusus dan telah mengonfigurasi kolam sumber daya elastis, layanan akan melakukan skala keluar menggunakan sumber daya publik ketika tidak ada sumber daya node yang tersedia di kelompok sumber daya khusus.

T: Bagaimana cara memperbarui layanan secara mulus?

  • Deskripsi masalah: Anda perlu memastikan layanan tidak terganggu selama pembaruan. Jika sumber daya khusus tidak mencukupi, layanan harus sementara menggunakan sumber daya publik untuk menyelesaikan pembaruan. Setelah pembaruan, instans harus dijadwalkan ulang kembali ke kelompok sumber daya khusus.

  • Solusi: Anda perlu menggunakan kombinasi rolling updates, descheduling sumber daya prioritas tinggi, dan kolam sumber daya elastis.

    1. Konfigurasi rolling updates: Ini memastikan layanan tidak terganggu. Konfigurasikan kebijakan rolling update di bawah Service Features > Stability Assurance. Untuk informasi lebih lanjut, lihat Rolling updates dan graceful exit.image

    2. Aktifkan kolam sumber daya elastis: Ini memungkinkan instans berlebih diterapkan ke kelompok sumber daya publik bayar sesuai penggunaan ketika kelompok sumber daya khusus tidak memiliki cukup sumber daya. Untuk informasi lebih lanjut, lihat Kolam sumber daya elastis.

    3. Aktifkan high-priority resource descheduling: Ketika ruang tersedia di kelompok sumber daya khusus (misalnya, saat instans lama dihapus), sistem secara otomatis menjadwalkan ulang instans dari kelompok sumber daya publik kembali ke kelompok sumber daya khusus untuk menghemat biaya.

Masalah pemanggilan layanan

Error pemanggilan layanan

Lakukan troubleshooting berdasarkan kode status yang dikembalikan. Untuk informasi lebih lanjut, lihat Lampiran: Kode status layanan dan error umum.

HTTPS dan nama domain kustom

T: Apakah layanan mendukung pemanggilan HTTPS? 

Ya. Anda cukup mengganti http:// dengan https:// di titik akhir layanan untuk transmisi terenkripsi. Jika klien, seperti Python requests, melaporkan error validasi sertifikat SSL, penyebabnya biasanya masalah konfigurasi lingkungan di sisi klien, bukan masalah pada layanan EAS itu sendiri.

T: Bagaimana cara memaksa akses HTTPS?

  • Shared gateway: Tidak mendukung pemaksaan HTTPS.

  • Dedicated gateway: Mendukung pemaksaan HTTPS. Anda dapat mengaktifkan HTTPS Redirection dalam konfigurasi dedicated gateway. Setelah diaktifkan, semua permintaan HTTP secara otomatis diarahkan ke HTTPS.image

T: Dapatkah saya menggunakan nama domain kustom untuk pemanggilan?

Ya. Anda perlu membuat dan menggunakan dedicated gateway yang dikelola sepenuhnya serta mengonfigurasi nama domain kustom Anda di gateway tersebut. Untuk informasi lebih lanjut, lihat Menggunakan dedicated gateway.

Manajemen token

T: Apakah token kedaluwarsa atau berubah?

Tidak. Token yang dihasilkan setelah layanan diterapkan bersifat jangka panjang. Merestart, memperbarui, atau menskalakan layanan tidak mengubah token, kecuali Anda mengubah metode autentikasi secara manual. Token tersebut hanya menjadi tidak valid ketika Anda mereset token secara manual atau menghapus layanan.

T: Dapatkah saya membuat beberapa token untuk satu layanan?

Tidak. Layanan EAS hanya mendukung satu Token autentikasi. Untuk menerapkan manajemen izin multi-pengguna atau metering terpisah, kami merekomendasikan Anda menggunakan solusi yang lebih fleksibel, seperti autentikasi Alibaba Cloud RAM.

Masalah pemanggilan lainnya

T: Bagaimana cara mengaktifkan respons streaming (Streaming) untuk layanan LLM?

Layanan EAS itu sendiri tidak menyediakan sakelar global untuk streaming. Anda harus secara eksplisit menentukan bahwa Anda menginginkan keluaran streaming dalam badan permintaan setiap panggilan API. Misalnya, saat Anda memanggil layanan LLM yang kompatibel dengan format OpenAI, tambahkan "stream": true ke badan permintaan JSON.

T: Apa perbedaan antara pemanggilan titik akhir VPC dan koneksi langsung VPC?

  • Pemanggilan titik akhir VPC: Metode ini menggunakan SLB internal-facing dan gateway (titik akhir publik menggunakan SLB internet-facing dan gateway). Ini adalah model permintaan standar. Dalam model ini, permintaan diteruskan melalui Lapisan 4 SLB dan Lapisan 7 gateway untuk mencapai instans layanan. Dalam skenario trafik tinggi dan konkurensi tinggi, penerusan ini menyebabkan overhead performa tertentu. Gateway juga memiliki batas bandwidth, yaitu 1 Gbps secara default.

  • Koneksi langsung VPC: EAS menyediakan mode akses koneksi langsung berkecepatan tinggi yang mengatasi masalah performa dan skalabilitas tanpa biaya tambahan. Setelah Anda mengaktifkan koneksi langsung VPC, jalur jaringan dibuat antara VPC Anda dan VPC layanan EAS. Permintaan Anda menggunakan fitur penemuan layanan yang disediakan oleh EAS untuk menemukan layanan, lalu memulai permintaan yang diseimbangkan beban dari klien. Proses ini mengharuskan Anda menggunakan SDK yang disediakan oleh EAS dan mengatur endpoint_type ke DIRECT.

    Misalnya, dalam skenario yang dijelaskan di Petunjuk penggunaan SDK Python, Anda dapat menambahkan baris kode berikut untuk beralih dari pemanggilan gateway ke koneksi langsung:

    • client = PredictClient('http://pai-eas-vpc.cn-hangzhou.aliyuncs.com', 'mnist_saved_model_example')
      client.set_token('M2FhNjJlZDBmMzBmMzE4NjFiNzZhMmUxY2IxZjkyMDczNzAzYjFi****')
      client.set_endpoint_type(ENDPOINT_TYPE_DIRECT) # Direct link
      client.init()

Izin dan jaringan

T: Mengapa pengguna RAM tidak dapat secara otomatis membuat atau menghapus peran terkait layanan EAS?

Hanya pengguna dengan izin tertentu yang dapat secara otomatis membuat atau menghapus AliyunServiceRoleForPaiEas. Oleh karena itu, jika pengguna RAM tidak dapat secara otomatis membuat atau menghapus AliyunServiceRoleForPaiEas, Anda harus memberikan kebijakan akses yang diperlukan kepada pengguna RAM tersebut. Prosedurnya sebagai berikut:

  1. Buat kebijakan kustom menggunakan skrip kebijakan berikut. Untuk informasi lebih lanjut, lihat Membuat kebijakan izin kustom.

    Kebijakan akses untuk membuat atau menghapus peran terkait layanan

    {
      "Statement": [
        {
          "Action": "ram:CreateServiceLinkedRole",
          "Resource": "*",
          "Effect": "Allow",
          "Condition": {
            "StringEquals": {
              "ram:ServiceName": "eas.pai.aliyuncs.com"
            }
          }
        }
      ],
      "Version": "1"
    }
  2. Berikan kebijakan kustom yang Anda buat pada langkah sebelumnya kepada pengguna RAM target. Untuk informasi lebih lanjut, lihat Mengelola izin pengguna RAM.

T: Bagaimana layanan EAS mengakses Internet dari dalam layanan?

Secara default, layanan EAS tidak dapat mengakses Internet publik. Untuk mengakses Internet publik, Anda harus mengonfigurasi VPC dengan kemampuan akses Internet untuk layanan EAS. Untuk informasi lebih lanjut, lihat Mengakses sumber daya publik atau privat dari EAS.

Manajemen layanan

T: Apakah instans EAS mendukung login SSH?

Tidak. Sebagai layanan terkelola, EAS tidak menyediakan izin SSH untuk mengakses kontainer. Untuk mengeksekusi perintah tertentu saat kontainer dimulai, Anda dapat menentukannya di field Run Command dalam konfigurasi layanan.

T: Apa saja status layanan EAS?

Layanan EAS dapat memiliki status berikut. Anda juga dapat membuka halaman Elastic Algorithm Service (EAS) dan melihat kolom Service Status.

  • Creating: Layanan sedang dibuat.

  • Waiting: Layanan sedang menunggu instans dimulai.

  • Stopped: Layanan dihentikan.

  • Failed: Layanan gagal.

  • Updating: Layanan sedang diperbarui. Instans akan diperbarui.

  • Stopping: Layanan sedang dihentikan.

  • HotUpdate: Layanan sedang diperbarui. Ini adalah pembaruan panas, dan instans tidak diperbarui.

  • Starting: Layanan sedang dimulai.

  • DeleteFailed: Layanan gagal dihapus.

  • Running: Layanan sedang berjalan.

  • Scaling: Layanan sedang diperbarui, dan instans sedang diskalakan.

  • Pending: Layanan sedang menunggu tindakan tertentu.

  • Deleting: Layanan sedang dihapus.

  • Completed: Tugas selesai.

  • Preparing

T: Bagaimana cara memeriksa pengguna RAM mana yang membuat layanan?

Anda dapat mengkueri event di Konsol ActionTrail. Atur nama event ke CreateService. Untuk informasi lebih lanjut, lihat Mengkueri event di Konsol ActionTrail.

T: Dapatkah saya mengunduh gambar EAS resmi dari Internet?

Tidak. Gambar resmi PAI adalah gambar platform internal. Anda hanya dapat menggunakannya di platform PAI. Anda tidak dapat mengunduhnya dari luar kontainer platform.

Lainnya

T: Mengapa saya tidak dapat memilih Bucket OSS saat menerapkan layanan EAS?

Saat menerapkan layanan EAS, Anda dapat mengonfigurasi model dan kode menggunakan mounts. Pastikan Bucket OSS dan sistem file NAS yang Anda gunakan berada di wilayah yang sama dengan layanan EAS. Jika tidak, Anda tidak dapat memilihnya.

T: Masalah TensorFlow

Untuk informasi lebih lanjut, lihat FAQ TensorFlow.