All Products
Search
Document Center

E-MapReduce:FAQ manajemen kluster

Last Updated:Apr 25, 2026

Topik ini menjawab pertanyaan umum tentang pengelolaan kluster E-MapReduce (EMR).

Apakah saya dapat melakukan upgrade kluster EMR?

Tidak. Anda tidak dapat melakukan upgrade kluster EMR atau layanannya. Untuk menggunakan versi yang lebih baru, rilis kluster yang ada dan buat yang baru.

Layanan apa saja yang didukung oleh kluster EMR?

Layanan yang didukung bervariasi tergantung jenis dan versi kluster. Untuk informasi selengkapnya, lihat Versi rilis.

Apakah saya dapat menambahkan Zeppelin di konsol?

Tidak. Anda tidak dapat menambahkan Zeppelin sebagai layanan baru dari konsol EMR. Untuk menambahkan Zeppelin, instal di salah satu instance ECS node master. Anda juga dapat menginstal dan memelihara komponen lain secara manual pada instance ECS. Untuk informasi tentang layanan yang dapat ditambahkan ke berbagai jenis kluster, lihat Tambahkan layanan.

Apakah EMR mendukung Oozie dan alternatifnya?

Komponen Oozie tidak termasuk dalam kluster EMR DataLake yang menjalankan EMR V5.8.0 atau versi lebih baru, atau EMR V3.42.0 atau versi lebih baru. Jika Anda memerlukan layanan penjadwalan alur kerja, Anda dapat menggunakan EMR Workflow. Untuk informasi selengkapnya, lihat Apa itu EMR Workflow?.

Alasan adanya tiga node master pada kluster HA

Kluster ketersediaan tinggi EMR versi terbaru menggunakan tiga node master untuk keandalan yang lebih tinggi dibandingkan konfigurasi dua node master. Konfigurasi dua node master tidak lagi didukung, dan kelompok node master tidak dapat di-scale-in. Untuk kluster ini, EMR mendistribusikan node master di host fisik yang berbeda untuk mengurangi risiko kegagalan.

Mengaktifkan enkripsi disk data dan efeknya

Saat membuat kluster, Anda dapat mengaktifkan enkripsi disk data di bagian Advanced Configurations pada langkah Basic Configuration. Untuk informasi selengkapnya, lihat Aktifkan enkripsi disk data.

Penting

Anda hanya dapat mengaktifkan enkripsi disk data saat membuat kluster. Fitur ini tidak dapat diaktifkan untuk kluster yang sudah ada.

Setelah Anda mengaktifkan enkripsi disk data, data dienkripsi baik saat transit maupun saat disimpan. Fitur ini membantu memenuhi persyaratan keamanan dan kepatuhan. Enkripsi disk data transparan bagi aplikasi di lapisan OS instance ECS dan tidak memengaruhi eksekusi pekerjaan.

Cara membersihkan kluster yang gagal

Kegagalan pembuatan kluster biasanya disebabkan oleh konfigurasi RDS yang salah sehingga menyebabkan kegagalan penerapan, atau karena inventaris instance ECS tertentu tidak mencukupi.

Jika beberapa instance ECS berhasil dibuat tetapi status kluster adalah Startup Failed, rilis instance tersebut di Konsol ECS. Setelah semua instance dirilis, kluster EMR akan secara otomatis dirilis.

Jika penerapan EMR gagal dan status kluster adalah Unexpectedly Terminated, tidak ada sumber daya yang dibuat dan tidak ada biaya yang dikenakan. Anda dapat mengklik Delete di kolom Actions untuk kluster tersebut guna menghapusnya.

Menambahkan layanan ke kluster yang sudah ada

Ya. Anda dapat menambahkan layanan ke kluster setelah kluster dibuat. Untuk informasi selengkapnya, lihat Tambahkan layanan.

Penting
  • Setelah menambahkan layanan, Anda mungkin perlu mengubah konfigurasinya secara manual dan me-restart layanan tersebut. Kami menyarankan agar Anda melakukan operasi ini pada jam sepi.

  • Layanan yang tersedia bervariasi tergantung versi EMR. Layanan yang ditampilkan di konsol adalah layanan yang tersedia untuk Anda tambahkan.

Restart layanan setelah perubahan konfigurasi

Perubahan konfigurasi sisi server untuk layanan seperti Spark, Hive, dan HDFS hanya berlaku setelah Anda me-restart layanan tersebut. Perubahan konfigurasi sisi klien berlaku setelah Anda mengklik Deploy Client Configuration, tanpa perlu me-restart layanan. Untuk informasi selengkapnya tentang cara mengubah atau menambahkan item konfigurasi, lihat Kelola item konfigurasi.

Apa itu restart bergulir?

Mekanisme restart bergulir me-restart instance ECS satu per satu. Instance berikutnya hanya akan di-restart setelah instance sebelumnya dan semua layanannya sepenuhnya pulih. Setiap restart node membutuhkan waktu sekitar lima menit.

Mengaitkan IP publik ke kluster yang sudah ada

Anda dapat meminta alamat IP elastis (EIP) dan mengaitkannya dengan instance ECS di Virtual Private Cloud (VPC) yang tidak memiliki alamat IP publik. Hal ini memungkinkan instance ECS diakses melalui internet. Untuk informasi selengkapnya, lihat Kaitkan EIP.

Kapan harus mengaktifkan deployment set

Deployment set adalah fitur ECS yang mengontrol strategi distribusi instance ECS. Kami menyarankan Anda mengaktifkan fitur deployment set untuk kelompok node inti yang menggunakan tipe instans dengan disk lokal guna meningkatkan keamanan data. Deployment set mencegah beberapa instance ECS ditempatkan pada host fisik yang sama. Hal ini menghindari titik kegagalan tunggal dan membantu mencegah kehilangan data HDFS lokal di EMR jika host fisik mengalami kegagalan.

Karena keterbatasan deployment set ECS, maksimal 20 instance ECS dapat ditambahkan ke satu deployment set. Untuk informasi selengkapnya, lihat Aktifkan deployment set.

Menentukan deployment set saat scale-out kluster

Secara default, deployment set diaktifkan untuk tipe instans dengan disk lokal dan dinonaktifkan untuk tipe instans lainnya. Anda dapat menyesuaikan pengaturan ini sesuai kebutuhan. Untuk petunjuk cara mengaktifkan deployment set, lihat Aktifkan deployment set.

Menentukan ukuran disk saat scale-out kluster

Saat melakukan scale-out kluster, pengaturan kelompok node menentukan ukuran disk untuk node baru. Ukuran ini tidak dapat diubah selama proses scale-out. Jika diperlukan, Anda dapat menyesuaikan ukuran disk kelompok node tersebut. Untuk petunjuk cara memperluas disk, lihat Perbesar disk.

Apakah saya dapat memperluas atau memperkecil disk?

Anda hanya dapat memperluas disk data. Anda tidak dapat memperkecil disk data atau mengubah ukuran disk sistem.

Pada tab Nodes kluster target, klik Expand Disk untuk kelompok node target guna memperluas disk datanya. Untuk petunjuk spesifik, lihat Perbesar disk.

Scale-out dan scale-in kluster

Ya, tetapi aturan penskalaan bervariasi tergantung jenis node:

  • Scale-out: Anda hanya dapat melakukan scale-out pada kelompok node inti dan task. Konfigurasi node baru secara default sama dengan node yang sudah ada. Sebelum melakukan scale-out, pastikan semua pesanan terkait telah dibayar. Pesanan yang belum dibayar akan menyebabkan operasi scale-out gagal. Untuk petunjuk spesifik, lihat Scale out a cluster.

  • Scale-in: Kelompok node master tidak mendukung scale-in. Aturan untuk kelompok node lain bervariasi tergantung jenisnya:

    • Untuk kelompok node task dengan instans pay-as-you-go atau preemptible dan kelompok node Gateway pay-as-you-go, lihat Scale in a cluster.

    • Untuk kelompok node inti pay-as-you-go, kelompok node task langganan, dan kelompok node inti langganan, lihat Manually scale in a node group.

Error: "AddNumber is not valid" saat scale-out

  • Gejala: Anda menerima pesan error The specified parameter AddNumber is not valid. add instances number :xxx larger than deploymentSet availableAmount: xxx deploymentSetId: ds-uf6gwfou0a13kekupt14xxxx saat melakukan scale-out kluster.

  • Penyebab: Error ini menunjukkan bahwa fitur deployment set diaktifkan untuk kluster Anda, dan jumlah node dalam kelompok node telah mencapai batas deployment set. Untuk informasi selengkapnya tentang deployment set, lihat Aktifkan deployment set.

  • Solusi: Hubungi Dukungan ECS untuk meminta peningkatan kuota deployment set akun Anda.

Bagaimana cara menghentikan pengumpulan log layanan?

Jika Anda tidak ingin EMR mengumpulkan data Anda, Anda dapat menonaktifkan pengumpulan log operasional layanan.

Penting

Setelah Anda menonaktifkan pengumpulan log, fitur pemeriksaan kesehatan dan dukungan teknis untuk EMR menjadi terbatas, tetapi fitur lain tetap berfungsi normal. Oleh karena itu, lakukan dengan hati-hati.

Prosedur:

  1. Nonaktifkan pengumpulan log operasional layanan.

    • Saat pembuatan kluster: Pada langkah konfigurasi perangkat lunak, klik Collect Service Operational Logs.

    • Setelah kluster dibuat: Pada halaman Basic Information kluster target, di bagian Software Information, klik Collection Status of Service Operational Logs.

  2. Verifikasi bahwa pengumpulan telah dinonaktifkan.

    Periksa apakah namenode-log ada di /usr/local/ilogtail/user_log_config.json. Jika tidak ada, pengumpulan log layanan telah dinonaktifkan.

    Catatan

    Setelah Anda menonaktifkan pengumpulan log layanan, diperlukan waktu sekitar dua hingga tiga menit agar konfigurasi disinkronkan. Harap tunggu dengan sabar.

Informasi apa saja yang dikumpulkan oleh log operasional layanan?

Log operasional layanan hanya mencakup log dari komponen layanan yang sedang berjalan di kluster. Anda dapat mengaktifkan atau menonaktifkan pengumpulan semua log layanan dengan satu klik. Perhatikan bahwa jika Anda menonaktifkan pengumpulan log, fitur pemeriksaan kesehatan dan dukungan teknis kluster akan terbatas.

Penting

Pengumpulan log operasional layanan diaktifkan secara default saat Anda membuat kluster. Anda dapat memilih untuk menonaktifkan fitur ini jika diperlukan. Untuk petunjuknya, lihat Bagaimana cara menghentikan pengumpulan log layanan?.

Jenis kluster mana yang mendukung EMR Doctor?

Hanya jenis kluster DataLake dan Hadoop yang mendukung fitur pemeriksaan kesehatan. Setelah kluster dibuat, Anda dapat menggunakan fitur ini pada tab Monitoring and Diagnostics > Health Check untuk kluster target di konsol EMR.

Jika kluster Hadoop Anda tidak memiliki fitur ini, Anda harus mengaktifkan EMR Doctor. Untuk informasi selengkapnya, lihat Aktifkan EMR Doctor (untuk kluster Hadoop).

Dampak instalasi atau upgrade EMR Doctor

Menginstal atau melakukan upgrade EMR Doctor tidak akan me-restart layanan apa pun atau memengaruhi pekerjaan yang sedang berjalan. Setelah instalasi, EMR Doctor secara otomatis mengonfigurasi parameter yang diperlukan di kluster yang ada, sehingga Anda tidak perlu melakukan konfigurasi manual.

Selama instalasi atau upgrade, EMR Doctor menerapkan konfigurasi untuk layanan YARN, Spark, Tez, dan Hive. Jika Anda telah memodifikasi dan menyimpan beberapa konfigurasi tetapi belum menerapkannya, pastikan proses penerapan tidak memengaruhi layanan tersebut.

Data apa saja yang dikumpulkan oleh EMR Doctor?

EMR Doctor tidak mengumpulkan data aktual Anda, juga tidak memindai file atau konten file Anda.

EMR Doctor hanya mengumpulkan data event yang diperlukan, seperti waktu mulai dan selesai pekerjaan, metrik, dan pencacah (counter).

Apakah EMR Doctor gratis?

Ya. EMR Doctor saat ini gratis.

Bagaimana pengumpulan data memengaruhi eksekusi pekerjaan?

Pengumpulan metadata penyimpanan EMR Doctor secara dinamis menyesuaikan sumber daya yang digunakan untuk pengumpulan berdasarkan sumber daya pengguna dan tidak mengonsumsi sumber daya berlebihan.

Pengumpulan pekerjaan EMR Doctor menggunakan teknologi probe Java dan tidak menjalankan proses Java terpisah untuk pemantauan. Pengumpulan dilakukan secara asinkron dan tidak menghambat proses pekerjaan utama. Jika overhead pengumpulan menjadi terlalu tinggi, EMR Doctor secara otomatis membuang data. Anda juga dapat menyesuaikan parameter seperti frekuensi pengumpulan.

Tabel berikut menunjukkan beberapa hasil pengujian TPC-DS.

SQL dan engine

Dengan EMR Doctor

Tanpa EMR Doctor

query7 (Spark)

21,0 s

21,2s

query71 (Tez)

50,8s

49,8s

query19 (MapReduce)

68,6s

68,2s

Catatan

Implementasi TPC-DS dalam topik ini didasarkan pada benchmark TPC-DS. Hasilnya tidak dapat dibandingkan dengan hasil benchmark TPC-DS yang dipublikasikan karena pengujian di sini tidak memenuhi semua persyaratan benchmark TPC-DS.

Kapan laporan pengumpulan tersedia?

Setelah EMR Doctor diinstal atau di-upgrade, fitur laporan harian menganalisis data berdasarkan pekerjaan yang Anda jalankan dan apakah metadata penyimpanan dikumpulkan. Oleh karena itu, kluster harus memiliki beban kerja aktif.

  • Pekerjaan komputasi: Setelah pekerjaan komputasi di kluster dikumpulkan, laporan terbaru tersedia pada hari berikutnya. Laporan ini memberikan penilaian kluster dan rekomendasi berdasarkan analisis status eksekusi pekerjaan hari sebelumnya.

  • Analisis penyimpanan: EMR Doctor tidak mengaktifkan analisis penyimpanan secara default. Anda dapat mengaktifkannya secara manual. Setelah diaktifkan, pengumpulan biasanya berjalan sekitar pukul 10.00. Setelah pengumpulan selesai, analisis dijalankan dan laporan dihasilkan pada dini hari hari berikutnya. Jika Anda mengaktifkan pengumpulan pada sore hari, Anda harus menunggu hingga hari ketiga untuk melihat hasilnya.

Nilai spesifik untuk konfigurasi yang direkomendasikan

EMR Doctor memberikan rekomendasi arah, seperti mengurangi konfigurasi memori atau memodifikasi parameter GC, tetapi tidak memberikan nilai parameter spesifik. Hal ini karena EMR Doctor menggunakan pengambilan sampel pada titik waktu tertentu untuk pengumpulan guna meminimalkan dampak pada program Anda. Anda harus menguji dan memvalidasi semua konfigurasi yang direkomendasikan untuk beban kerja spesifik Anda.

Error: "Insufficient ECS inventory" saat scale-out

  • Gejala: Kluster gagal melakukan scale-out, dengan alasan kegagalan "Insufficient ECS inventory_OutofStock" atau "Insufficient ECS inventory_OperationDenied.NoStock".

  • Penyebab: Tipe instans ECS untuk kelompok node yang ingin Anda scale-out memiliki inventaris yang tidak mencukupi untuk memenuhi permintaan Anda.

  • Solusi: Tunggu hingga tipe instans ECS yang diperlukan tersedia kembali, lalu coba lakukan scale-out lagi, atau lakukan scale-out dengan membuat kelompok node baru dan memilih tipe instans ECS yang berbeda. Untuk informasi selengkapnya, lihat Buat kelompok node.

Error: "Insufficient ECS inventory" saat pembuatan kluster

  • Gejala: Pembuatan kluster atau penambahan kelompok node gagal, dengan alasan kegagalan "Insufficient ECS inventory_OutofStock" atau "Insufficient ECS inventory_OperationDenied.NoStock".

  • Penyebab: Tipe instans ECS yang Anda pilih untuk kluster atau kelompok node memiliki inventaris yang tidak mencukupi.

  • Solusi: Saat membuat kluster, pilih tipe instans ECS lain yang memiliki inventaris mencukupi dan memenuhi kebutuhan bisnis Anda.

Bagaimana cara menghapus layanan yang tidak diperlukan?

Anda tidak dapat menghapus layanan yang sudah ada dari kluster. Setelah layanan dijalankan, Anda tidak dapat menghapusnya dari konsol atau menggunakan API.

Cara login ke node kluster

Setelah kluster EMR dibuat, Anda dapat login ke node master menggunakan kata sandi yang ditetapkan saat pembuatan kluster. Untuk informasi tentang cara login ke node lainnya, lihat Login ke node lain dari kluster.

Cara melihat vSwitch instans

Di EMR on ECS, informasi vSwitch dikaitkan dengan kelompok node dan tidak dapat dilihat langsung di halaman Basic Information. Buka halaman Nodes dan klik nama kelompok node tempat instans tersebut berada untuk melihat informasi vSwitch yang terkait.image

Mengatasi kehilangan paket pada kluster berskala besar

  • Gejala: Terjadi kehilangan paket jaringan secara berkala di kluster, dan log sistem mungkin menampilkan pesan error seperti neighbour: arp_cache: neighbor table overflow!. Hal ini menunjukkan bahwa tabel cache Address Resolution Protocol (ARP) penuh dan tidak dapat lagi mengelola pemetaan alamat IP ke MAC, sehingga menyebabkan masalah kinerja jaringan.

  • Penyebab: Pada sistem terdistribusi berskala besar, terutama ketika satu kluster melebihi 1.000 server dan menjalankan versi sebelum EMR-5.18.0 atau EMR-3.52.0 (tidak termasuk), Anda mungkin mengalami ketidakstabilan jaringan dan kehilangan paket. Anda dapat mengoptimalkan manajemen cache ARP dengan menyesuaikan parameter sistem.

    Cache ARP menyimpan pemetaan antara alamat IP dan alamat MAC. Parameter utamanya adalah sebagai berikut:

    • net.ipv4.neigh.default.gc_thresh1: Jumlah minimum entri yang disimpan di cache ARP. Pengumpulan sampah tidak dilakukan jika jumlah entri di bawah nilai ini. Nilai default adalah 128.

    • net.ipv4.neigh.default.gc_thresh2: Batas lunak jumlah entri di cache ARP. Pengumpulan sampah dilakukan dalam waktu 5 detik jika jumlah entri melebihi nilai ini. Nilai default adalah 512.

    • net.ipv4.neigh.default.gc_thresh3: Batas keras jumlah entri di cache ARP. Nilai default adalah 1024.

    Catatan

    Nilai default terlalu kecil untuk kluster dengan lebih dari 1.000 node dan dapat menyebabkan kehilangan paket jaringan serta ketidakstabilan. Oleh karena itu, parameter harus disesuaikan.

  • Solusi:

    1. Edit file /etc/sysctl.conf dan tambahkan konten berikut untuk meningkatkan batas kapasitas cache ARP dan mengoptimalkan nilai pelacakan koneksi maksimum.

      net.ipv4.neigh.default.gc_thresh1 = 512
      net.ipv4.neigh.default.gc_thresh2 = 2048
      net.ipv4.neigh.default.gc_thresh3 = 10240
      net.nf_conntrack_max = 524288
    2. Jalankan perintah sudo sysctl -p untuk menerapkan pengaturan baru.

      Catatan

      Jika Anda menemui pesan error sysctl: cannot stat /proc/sys/net/nf_conntrack_max: No such file or directory saat menjalankan perintah sysctl -p, jalankan terlebih dahulu perintah sudo modprobe nf_conntrack untuk memuat modul yang sesuai. Kemudian, jalankan kembali perintah sysctl -p untuk memperbarui konfigurasi.

Menangani peristiwa SystemMaintenance.Redeploy

Jika Anda menerima peristiwa sistem bertipe Instance redeployment due to system maintenance (SystemMaintenance.Redeploy) untuk instans disk lokal, hal ini menunjukkan bahwa Alibaba Cloud telah mendeteksi potensi risiko kegagalan perangkat lunak atau perangkat keras pada host dasar instans ECS. Risiko ini mengharuskan instans ECS diredploy. Jangan mengklik Redeploy di konsol ECS secara langsung untuk menghindari kehilangan data.

Solusi:

  1. Periksa detail peristiwa untuk mengidentifikasi node yang terpengaruh.

  2. Pada kelompok node yang berisi node bermasalah, lakukan scale-out untuk menambahkan node baru. Untuk informasi selengkapnya, lihat Scale out a cluster.

  3. Lakukan scale-in pada node yang bermasalah.

    • Untuk melakukan scale-in pada kelompok node inti atau kelompok node task langganan, lihat Manually scale in a node group.

      Catatan

      Saat Anda merilis instans ECS langganan, ECS menghitung dan menampilkan jumlah pengembalian dana. Jika Anda memiliki pertanyaan, kirim tiket dan pilih Elastic Compute Service untuk Product.

    • Untuk melakukan scale-in pada kelompok node task pay-as-you-go, lihat Scale in a cluster.

Secara otomatis menambahkan tag ID kluster ke disk cloud

Untuk secara otomatis memberi tag disk cloud dari instance ECS kluster EMR Anda dengan ID kluster, aktifkan pewarisan tag di konsol Tag.

Prosedur:

  1. Login ke konsol Tag.

  2. Di panel navigasi sebelah kiri, pilih Tags > Tag inheritance.

  3. Baca petunjuk untuk mengaktifkan fitur dan centang kotak untuk membuat peran terkait layanan.

    Saat Anda mengaktifkan pewarisan tag, sistem secara otomatis membuat peran terkait layanan bernama AliyunServiceRoleForTag untuk melakukan operasi terkait pewarisan tag. Untuk informasi selengkapnya, lihat Peran terkait layanan untuk Tag.

  4. Klik Enable and set rules.

  5. Konfigurasikan aturan pewarisan tag.

    Untuk sumber daya yang mendukung pewarisan tag, tentukan kunci tag yang akan diwariskan. Anda dapat memilih untuk mewariskan semua kunci tag atau hanya kunci tag tertentu.

    image

  6. Klik OK.

Untuk informasi selengkapnya tentang pengaturan tag, lihat Pewarisan tag.

Error: IdempotentParameterMismatch

  • Gejala: Anda mungkin mengalami pesan error berikut saat melakukan operasi seperti merilis kluster atau meng-upgrade konfigurasi.

  • Penyebab: Token klien yang sama digunakan dalam beberapa permintaan.

    The request uses the same client token as a previous, but non-identical request. Do not reuse a client token with different requests, unless the requests are identical.
  • Solusi: Periksa apakah operasi Anda sedang berlangsung. Jika ya, jangan kirim ulang. Jika tidak, refresh halaman konsol. Konsol EMR secara otomatis menghasilkan token klien baru.

Error: QuotaExceeded.PrivateIpAddress

  • Gejala: Anda mungkin mengalami pesan error berikut saat membuat atau melakukan scale-out kluster.

    [QuotaExceeded.PrivateIpAddress] The specified VSwitch "vsw-xxxx" does not have enough IP addresses.
  • Penyebab: vSwitch yang dipilih tidak memiliki cukup alamat IP pribadi yang tersedia untuk memenuhi permintaan pembuatan atau scale-out kluster.

  • Solusi: Buat kelompok node baru dan pilih vSwitch yang memiliki jumlah alamat IP yang mencukupi. Kemudian, coba ulang operasi pembuatan atau scale-out kluster.

Error: LostProxy

  • Gejala: Error "taihao-proxy disconnect" terjadi saat Anda membuat kluster, melakukan scale-out kluster, atau memperbarui konfigurasi layanan.

  • Penyebab: Agen manajemen EMR (proxy) pada node kluster kehilangan koneksi.

  • Solusi:

    1. Periksa status kluster dan perbaiki masalah node.

      • Jika beberapa node terputus, periksa metrik CPU dan memori.

        • Jika utilisasi CPU atau memori tinggi, kluster kelebihan beban. Upgrade konfigurasi atau lakukan scale-out kluster untuk mengurangi tekanan.

        • Jika utilisasi CPU dan memori rendah, periksa konfigurasi grup keamanan untuk memastikan komunikasi jaringan normal.

      • Jika hanya beberapa node yang terputus, periksa beban pada node tersebut untuk menentukan apakah utilisasi CPU atau memori mencapai 100%. Jika beban terlalu tinggi, periksa proses abnormal yang mengonsumsi sumber daya. Jika ditemukan, hentikan proses tersebut dan periksa apakah status node kembali normal. Jika tidak ditemukan proses abnormal, pertimbangkan solusi berikut:

        • Untuk node master, selidiki proses yang memiliki konsumsi CPU tinggi. Anda dapat meng-upgrade spesifikasi node master atau menambahkan node MASTER-EXTEND untuk mendistribusikan beban.

        • Untuk node non-master, jika satu instance ECS kelebihan beban atau tidak merespons, Anda dapat mendekomisioning node bermasalah atau menambahkan node baru.

          Login ke node dan jalankan perintah berikut untuk me-restart layanan.

          service taihao-proxy restart
    2. Setelah menyelesaikan pemeriksaan dan operasi, coba ulang pembuatan kluster, scale-out, atau pembaruan konfigurasi layanan.

Error: "Insufficient account balance"

  • Gejala: Anda mengalami pesan error berikut saat membuat, melakukan scale-out, atau upgrade kluster.

    InvalidAccountStatus.NotEnoughBalance Message: Your account does not have enough balance to order pay-as-you-go products. 
  • Penyebab: Saldo akun Anda tidak mencukupi.

  • Solusi: Periksa saldo akun Anda dan pastikan mencukupi untuk menutupi biaya sumber daya yang diperlukan. Setelah saldo Anda mencukupi, coba ulang operasi tersebut.

Error: QuotaExceed.DiskCapacity

  • Gejala: Anda mungkin mengalami pesan error berikut saat melakukan scale-out kluster atau memperluas disk.

    [QuotaExceed.DiskCapacity] The used capacity of disk type has exceeded the quota in the zone,  quota check fail.
  • Penyebab: Kuota disk untuk instans telah mencapai batasnya.

  • Solusi: Kapasitas yang digunakan untuk tipe disk yang ditentukan telah melebihi kuota di zona ketersediaan. Buka Pusat Kuota untuk mengkueri dan mengajukan peningkatan kuota kapasitas disk Anda.

Error: QuotaExceed.ElasticQuota

  • Gejala: Anda mungkin mengalami pesan error berikut saat membuat atau melakukan scale-out kluster.

    QuotaExceed.ElasticQuota Message: The number of the specified ECS instances has exceeded the quota of the specified instance type. 
  • Penyebab: Kuota instans ECS telah tercapai.

  • Solusi: Pilih tipe instans yang berbeda atau kurangi jumlah instans dan coba lagi. Anda juga dapat meminta peningkatan kuota di konsol ECS atau Pusat Kuota.

Menangani kegagalan tindakan bootstrap

Periksa log eksekusi tindakan bootstrap yang gagal dalam riwayat operasi:

  • Jika log berisi pesan error yang jelas, perbaiki skrip bootstrap berdasarkan pesan error tersebut dan coba ulang operasi.

  • Jika log berisi kata kunci exitCode tetapi tidak ada error yang jelas, tambahkan logging yang lebih detail ke skrip bootstrap untuk debugging yang lebih baik, lalu coba ulang operasi.

  • Jika tugas timeout atau tidak ada output di log, periksa hal berikut:

    • Pastikan pengguna memiliki izin baca pada Bucket OSS tempat skrip bootstrap berada.

    • Periksa konfigurasi jaringan ECS untuk memastikan dapat mengakses titik akhir internal OSS, lalu coba ulang operasi.

Error inisialisasi SparkContext dari EMR Gateway