Topik ini memberikan jawaban atas beberapa pertanyaan umum terkait manajemen kluster.
Mengapa kluster EMR dengan ketersediaan tinggi memiliki tiga node master?
Apakah saya bisa menambahkan layanan Zeppelin di konsol EMR?
Apakah saya bisa melakukan penskalaan keluar atau penskalaan masuk pada kluster EMR?
Bagaimana cara menentukan ukuran disk saat saya melakukan penskalaan keluar pada kluster EMR?
Dalam skenario apa saya perlu mengaktifkan Tambahkan ke Set Penyebaran?
Bagaimana cara mengaitkan alamat IP publik dengan instance ECS dalam kluster EMR yang ada?
Bagaimana cara memodifikasi konfigurasi instance ECS dalam grup node?
Bagaimana cara menghentikan pengumpulan log operasional layanan?
Apa yang harus saya lakukan jika kehilangan paket sering terjadi di kluster?
Apa yang harus saya lakukan jika terjadi peristiwa sistem ECS bernama SystemMaintenance.Redeploy?
Apa yang harus saya lakukan jika pesan kesalahan IdempotentParameterMismatch muncul?
Apa yang harus saya lakukan jika pesan kesalahan QuotaExceeded.PrivateIpAddress muncul?
Apa yang harus saya lakukan jika pesan kesalahan LostProxy muncul?
Apa yang harus saya lakukan jika skrip boot gagal dieksekusi?
FAQ tentang Layanan:
FAQ tentang EMR Doctor:
Apakah saya bisa memutakhirkan kluster EMR?
Tidak, Anda tidak dapat memutakhirkan kluster E-MapReduce (EMR) dan layanan yang diterapkan dalam kluster tersebut. Untuk memutakhirkan kluster EMR atau layanan yang diterapkan dalam kluster tersebut, lepaskan kluster dan buat kluster lain.
Layanan apa saja yang didukung oleh kluster EMR?
Layanan yang didukung oleh kluster EMR bervariasi berdasarkan versi kluster dan jenis kluster. Untuk informasi lebih lanjut, lihat Distribusi.
Apakah saya bisa menambahkan layanan Zeppelin di konsol EMR?
EMR tidak mengizinkan Anda menambahkan layanan Zeppelin di konsol EMR. Anda dapat menginstal Zeppelin pada instance Elastic Compute Service (ECS) yang digunakan sebagai node master. Untuk layanan lain yang tidak dapat ditambahkan di konsol EMR, Anda dapat menginstal dan melakukan operasi pemeliharaan pada mereka di instance ECS yang mendasarinya. Untuk informasi lebih lanjut tentang skenario kluster dan layanan yang didukung, lihat Tambahkan layanan.
Apakah kluster EMR mendukung Oozie? Apa yang harus saya lakukan jika Oozie tidak didukung dan saya ingin menggunakan layanan tersebut?
Kluster DataLake EMR V5.8.0 atau versi minor lebih baru dan EMR V3.42.0 atau versi minor lebih baru tidak menyediakan Oozie. Jika Anda ingin menggunakan alur kerja untuk menjadwalkan layanan, Anda dapat menggunakan EMR Workflow. Untuk informasi lebih lanjut, lihat Apa itu EMR Workflow?
Mengapa kluster EMR dengan ketersediaan tinggi memiliki tiga node master?
Kluster EMR dengan ketersediaan tinggi dengan tiga node master lebih andal daripada kluster EMR dengan ketersediaan tinggi dengan dua node master. Kluster EMR dengan ketersediaan tinggi dengan hanya dua node master tidak lagi didukung.
Untuk kluster dengan ketersediaan tinggi, EMR mendistribusikan node master di perangkat keras dasar yang berbeda untuk mengurangi risiko kegagalan.
Bagaimana cara mengaktifkan enkripsi disk data? Apa dampaknya setelah saya mengaktifkan enkripsi disk data?
Saat Anda membuat kluster EMR, Anda dapat menentukan apakah akan mengaktifkan Enkripsi Disk Data di bagian Advanced Settings langkah Basic Configuration. Untuk informasi lebih lanjut, lihat Aktifkan enkripsi disk data.
Anda hanya dapat mengaktifkan enkripsi disk data saat Anda membuat kluster EMR. Anda tidak dapat mengaktifkan enkripsi disk data untuk kluster EMR yang sudah ada.
Setelah disk dienkripsi, data dalam transit dan data diam di disk dienkripsi. Anda dapat menggunakan fitur enkripsi disk data jika bisnis Anda memiliki persyaratan kepatuhan keamanan. Enkripsi disk data transparan bagi aplikasi di tingkat sistem operasi instance ECS dan tidak memengaruhi jalannya pekerjaan.
Bagaimana cara melepaskan kluster yang gagal dibuat?
Dalam banyak kasus, pembuatan kluster EMR gagal disebabkan oleh konfigurasi RDS yang salah atau tipe instance ECS yang dipilih tidak tersedia.
Jika beberapa instance ECS dibuat dan status kluster adalah Startup Failed, Anda harus pergi ke konsol ECS untuk melepaskan instance ECS tersebut. Setelah Anda melepaskan instance ECS, sistem akan melepaskan kluster EMR.
Jika kluster EMR gagal diterapkan dan status kluster adalah Terminated Unexpectedly, kluster tersebut tidak memiliki sumber daya dan Anda tidak dikenakan biaya untuk kluster tersebut. Anda dapat mengklik Delete di kolom Aksi untuk menghapus kluster.
Apakah saya bisa menambahkan layanan ke kluster EMR setelah saya membuat kluster tersebut?
EMR mengizinkan Anda menambahkan layanan tertentu ke kluster EMR setelah Anda membuat kluster tersebut. Untuk informasi lebih lanjut, lihat Tambahkan layanan.
Setelah Anda menambahkan layanan, Anda mungkin perlu memodifikasi konfigurasi terkait dari layanan yang ada tertentu dan memulai ulang layanan yang ada agar konfigurasi tersebut berlaku. Kami sarankan Anda menambahkan layanan selama jam-jam sepi.
Layanan yang dapat Anda tambahkan ke kluster bervariasi berdasarkan versi EMR. Layanan aktual yang dapat Anda tambahkan ke kluster ditampilkan di konsol EMR.
Apakah saya perlu memulai ulang layanan setelah saya memodifikasi konfigurasi layanan tersebut?
Jika Anda memodifikasi konfigurasi sisi server kluster EMR, seperti konfigurasi Spark, Hive, atau Hadoop Distributed File System (HDFS), Anda harus memulai ulang layanan agar modifikasi tersebut berlaku. Jika Anda memodifikasi konfigurasi sisi klien kluster EMR, Anda hanya perlu mengklik Deploy Client Configuration agar modifikasi tersebut berlaku. Untuk informasi tentang cara memodifikasi atau menambah item konfigurasi, lihat Kelola item konfigurasi.
Apa itu restart bergulir?
Restart bergulir mengacu pada proses di mana sistem hanya memulai ulang instance ECS setelah instance ECS sebelumnya dimulai ulang dan semua layanan big data yang diterapkan pada instance ECS sebelumnya dipulihkan. Dibutuhkan sekitar lima menit untuk memulai ulang instance ECS.
Bagaimana cara mengaitkan alamat IP publik dengan instance ECS dalam kluster EMR yang ada?
Anda dapat membuat alamat IP elastis (EIP) dan mengaitkan EIP dengan instance ECS tipe jaringan virtual private cloud (VPC) yang tidak memiliki alamat IP publik. Dengan cara ini, Anda dapat mengakses instance tersebut melalui Internet. Untuk informasi lebih lanjut, lihat Kaitkan EIP dengan instance.
Dalam skenario apa saya perlu mengaktifkan Tambahkan ke Set Penyebaran?
Fitur set penyebaran disediakan oleh Alibaba Cloud ECS dan digunakan untuk mengontrol distribusi instance ECS. Jika node inti kluster Anda menggunakan instance ECS yang dilengkapi dengan disk lokal, kami sarankan Anda mengaktifkan Tambahkan ke Set Penyebaran untuk meningkatkan keamanan data. Anda dapat mengaktifkan Tambahkan ke Set Penyebaran untuk mencegah beberapa instance ECS diterapkan pada mesin fisik yang sama. Dengan cara ini, jika mesin fisik gagal, instance ECS pada mesin fisik lainnya tidak terpengaruh dan data HDFS lokal tidak hilang.
Anda dapat menambahkan hingga 20 instance ECS ke set penyebaran. Untuk informasi lebih lanjut, lihat Tambahkan node ke set penyebaran.
Bagaimana cara mengonfigurasi parameter Tambahkan ke Set Penyebaran saat saya melakukan penskalaan keluar pada kluster EMR?
Secara default, Tambahkan ke Set Penyebaran diaktifkan untuk instance ECS yang dilengkapi dengan disk lokal dan dinonaktifkan untuk instance ECS yang dilengkapi dengan disk lainnya. Anda dapat menentukan apakah akan mengaktifkan Tambahkan ke Set Penyebaran berdasarkan kebutuhan bisnis Anda. Untuk informasi lebih lanjut, lihat Tambahkan node ke set penyebaran.
Bagaimana cara menentukan ukuran disk saat saya melakukan penskalaan keluar pada kluster EMR?
Saat Anda melakukan penskalaan keluar pada kluster EMR, ukuran disk node baru sama dengan ukuran disk node yang ada dalam grup node dan tidak dapat diubah. Anda dapat memperluas disk grup node berdasarkan kebutuhan bisnis Anda. Untuk informasi lebih lanjut, lihat Perluas disk.
Apakah saya bisa mengubah ukuran disk kluster EMR?
Anda dapat memperluas tetapi tidak dapat memperkecil disk data kluster EMR. Anda tidak dapat mengubah ukuran disk sistem.
Untuk memperluas disk data kluster EMR, lakukan langkah-langkah berikut: Pada tab Nodes kluster yang diinginkan, temukan grup node dan klik Expand Disk di kolom Aksi. Untuk informasi lebih lanjut, lihat Perluas disk.
Apakah saya bisa melakukan penskalaan keluar atau penskalaan masuk pada kluster EMR?
Ya, Anda bisa melakukan penskalaan keluar atau penskalaan masuk pada kluster EMR. Namun, aturan penskalaan masuk dan penskalaan keluar bervariasi berdasarkan tipe node.
Penskalaan keluar: Anda hanya dapat menambahkan node inti dan node tugas. Secara default, konfigurasi node yang ditambahkan sama dengan konfigurasi node yang ada dalam grup node. Selama penskalaan keluar, pastikan Anda menyelesaikan pembayaran untuk pesanan Anda. Jika Anda tidak menyelesaikan pembayaran untuk pesanan Anda, penskalaan keluar gagal. Untuk informasi lebih lanjut, lihat Lakukan penskalaan keluar pada kluster EMR.
Penskalaan masuk: Aturan penskalaan masuk bervariasi berdasarkan tipe node.
Untuk informasi tentang cara melakukan penskalaan masuk pada grup node tugas, lihat Lakukan penskalaan masuk pada kluster.
Untuk informasi tentang cara melakukan penskalaan masuk pada grup node inti, lihat Lakukan penskalaan masuk pada grup node.
Bagaimana cara memodifikasi konfigurasi instance ECS dalam grup node?
Anda dapat meningkatkan spesifikasi grup node dalam kluster EMR berlangganan untuk memodifikasi konfigurasi instance ECS dalam grup node tersebut. Anda tidak dapat menurunkan spesifikasi grup node.
Untuk meningkatkan spesifikasi grup node, lakukan langkah-langkah berikut: Pada tab Nodes kluster yang diinginkan, temukan grup node yang diinginkan, arahkan kursor ke ikon
di kolom Aksi, dan kemudian pilih Upgrade Configuration. Untuk informasi lebih lanjut, lihat Tingkatkan konfigurasi node.
Apa yang harus saya lakukan jika pesan kesalahan "Parameter AddNumber yang ditentukan tidak valid" muncul selama penskalaan keluar kluster?
Deskripsi masalah: Pesan kesalahan
Parameter AddNumber yang ditentukan tidak valid. jumlah instance yang ditambahkan :xxx lebih besar dari jumlah tersedia di set penyebaran: xxx ID set penyebaran: ds-uf6gwfou0a13kekupt14xxxxmuncul selama penskalaan keluar kluster.Penyebab: Tambahkan ke Set Penyebaran diaktifkan untuk kluster yang ingin Anda skalakan keluar, dan jumlah node dalam grup node melebihi batas atas dalam set penyebaran. Untuk informasi lebih lanjut tentang set penyebaran, lihat Tambahkan node ke set penyebaran.
Solusi: Hubungi dukungan teknis ECS untuk meningkatkan jumlah maksimum node yang dapat ditambahkan ke set penyebaran untuk akun Anda saat ini.
Bagaimana cara menghentikan pengumpulan log operasional layanan?
Jika Anda tidak ingin EMR mengumpulkan data Anda, Anda dapat menonaktifkan pengumpulan log operasional layanan.
Jika Anda menonaktifkan pengumpulan log operasional layanan, pemeriksaan kesehatan kluster EMR dan dukungan teknis terbatas. Fitur lain dari kluster Anda tetap tersedia. Lanjutkan dengan hati-hati.
Solusi:
Nonaktifkan pengumpulan log operasional layanan.
Saat Anda membuat kluster, matikan Collect Service Operational Logs di langkah Konfigurasi Perangkat Lunak.
Untuk kluster yang sudah ada, matikan Collection Status of Service Operational Logs di bagian Software Information tab Basic Information kluster.
Periksa apakah pengumpulan log operasional layanan dinonaktifkan.
Periksa apakah informasi
namenode-logada di file /usr/local/ilogtail/user_log_config.json. Jika informasi namenode-log tidak ada, pengumpulan log operasional layanan dinonaktifkan.CatatanSetelah Anda menonaktifkan pengumpulan log operasional layanan, dibutuhkan sekitar 2 hingga 3 menit agar konfigurasi berlaku.
Informasi apa saja yang dikumpulkan dalam log operasional layanan?
Log operasional layanan hanya berisi data tentang jalannya komponen layanan pada kluster. Anda dapat mengaktifkan atau menonaktifkan pengumpulan log untuk semua layanan dengan satu klik. Jika Anda menonaktifkan pengumpulan log, pemeriksaan kesehatan kluster EMR dan dukungan teknis purna jual terbatas.
Kumpulkan Log Operasional Layanan diaktifkan secara default saat Anda membuat kluster. Anda dapat menentukan apakah akan mematikan sakelar berdasarkan kebutuhan bisnis Anda. Untuk informasi lebih lanjut, lihat Bagaimana cara menghentikan pengumpulan log operasional layanan?.
Jenis kluster apa saja yang mendukung EMR Doctor (fitur diagnostik kesehatan di konsol EMR)?
Hanya kluster DataLake dan Hadoop yang mendukung fitur diagnostik kesehatan. Setelah Anda membuat kluster EMR, Anda dapat mengklik subtab Health Diagnostics pada tab Monitoring and Diagnostics kluster untuk menggunakan fitur pemeriksaan kesehatan.
Jika Anda membuat kluster EMR Hadoop, Anda harus mengaktifkan EMR Doctor sebelum Anda dapat menggunakan fitur diagnostik kesehatan di kluster tersebut. Untuk informasi lebih lanjut, lihat Aktifkan EMR Doctor (kluster Hadoop).
Apakah instalasi atau pemutakhiran EMR Doctor memberikan dampak pada layanan dalam kluster EMR dan pekerjaan yang berjalan di kluster tersebut?
Selama instalasi atau pemutakhiran EMR Doctor, tidak ada layanan dalam kluster EMR yang dimulai ulang, dan tidak ada dampak yang diberikan pada pekerjaan yang ada yang berjalan di kluster tersebut. Setelah EMR Doctor diinstal, parameter yang diperlukan untuk EMR Doctor secara otomatis dikonfigurasikan untuk kluster. Anda tidak perlu melakukan konfigurasi manual.
Selama instalasi atau pemutakhiran EMR Doctor, EMR menyampaikan konfigurasi layanan seperti YARN, Spark, Tez, dan Hive ke kluster. Sebelum Anda menginstal atau memutakhirkan EMR Doctor, kami sarankan Anda memeriksa apakah beberapa konfigurasi layanan telah dimodifikasi dan disimpan tetapi belum disampaikan dan mengevaluasi dampak penyampaian konfigurasi layanan ke kluster.
Jenis data apa yang dikumpulkan oleh EMR Doctor?
EMR Doctor tidak mengumpulkan data aktual Anda atau memindai file atau konten file aktual Anda.
EMR Doctor hanya mengumpulkan data peristiwa yang diperlukan, seperti waktu mulai, waktu akhir, metrik, dan penghitung pekerjaan.
Apakah saya dikenakan biaya untuk EMR Doctor?
EMR Doctor gratis.
Apa dampak pengumpulan data pekerjaan terhadap eksekusi pekerjaan?
Fitur pengumpulan metadata penyimpanan EMR Doctor dapat menyesuaikan jumlah sumber daya yang dikumpulkan secara dinamis berdasarkan jumlah sumber daya pengguna. Ini mencegah sumber daya pengguna yang berlebihan dari digunakan.
Fitur pengumpulan pekerjaan EMR Doctor bekerja berdasarkan teknologi probe Java. Fitur ini tidak memulai pemantauan proses Java secara terpisah. Data pekerjaan dikumpulkan dalam mode asinkron. Ini tidak memblokir proses utama pekerjaan. Jika tekanan pengumpulan pekerjaan berat, data yang dikumpulkan secara otomatis dibuang, dan Anda dapat menyesuaikan frekuensi pengumpulan dengan mengonfigurasi parameter.
Tabel berikut mencantumkan data dari beberapa tes TPC-DS.
SQL dan mesin | Durasi pengumpulan saat EMR Doctor digunakan (durasi rata-rata pengumpulan pekerjaan berdasarkan 10 putaran perhitungan) | Durasi pengumpulan saat EMR Doctor tidak digunakan (durasi rata-rata pengumpulan pekerjaan berdasarkan 10 putaran perhitungan) |
query7 (Spark) | 21.0s | 21.2s |
query71 (Tez) | 50.8s | 49.8s |
query19 (MapReduce) | 68.6s | 68.2s |
Dalam contoh ini, tes berdasarkan benchmark TPC-DS dilakukan, tetapi tes tersebut tidak memenuhi semua persyaratan tes benchmark TPC-DS. Akibatnya, hasil tes mungkin tidak sesuai dengan hasil yang diterbitkan dari tes benchmark TPC-DS.
Kapan saya bisa mendapatkan laporan pengumpulan?
Setelah EMR Doctor diinstal atau diperbarui dalam kluster EMR, fitur laporan kluster harian melakukan analisis berdasarkan pekerjaan yang ingin dijalankan pengguna dan apakah fitur pengumpulan metadata penyimpanan diaktifkan. Dalam hal ini, kluster EMR harus berisi pekerjaan.
Pekerjaan komputasi: Setelah pekerjaan komputasi dalam kluster EMR dikumpulkan, laporan terbaru untuk pekerjaan tersebut dapat dilihat pada hari berikutnya. Isi laporan adalah evaluasi keseluruhan kluster berdasarkan status eksekusi pekerjaan dalam kluster.
Analisis penyimpanan: Fitur Kumpulkan Informasi Tentang Sumber Daya Penyimpanan EMR Doctor dinonaktifkan secara default. Anda dapat mengaktifkan fitur ini secara manual. Setelah Anda mengaktifkan fitur Kumpulkan Informasi Tentang Sumber Daya Penyimpanan, informasi terkait dikumpulkan pada pukul 10:00 pagi hari itu. Setelah data dikumpulkan, data tersebut dianalisis di pagi hari pada hari berikutnya dan laporan dihasilkan berdasarkan hasil analisis. Jika data dikumpulkan pada sore hari hari itu, Anda dapat melihat laporan pada hari setelah besok.
Apakah nilai spesifik dapat diberikan untuk parameter?
Saran optimasi yang diberikan oleh EMR Doctor bersifat arah. Misalnya, kami sarankan Anda mengurangi jumlah memori dan memodifikasi parameter pengumpulan sampah tanpa memberikan nilai parameter spesifik. EMR Doctor mengumpulkan data pekerjaan menggunakan metode perekaman dan pengambilan sampel. EMR Doctor bertujuan untuk mencegah dampak pada program Anda. Anda perlu menyesuaikan parameter berdasarkan saran dan memeriksa apakah konfigurasi tersebut sesuai.
Apa yang harus saya lakukan jika pesan kesalahan yang menunjukkan sumber daya ECS tidak mencukupi muncul saat saya melakukan penskalaan keluar kluster?
Deskripsi masalah: Kluster gagal diskalakan keluar, dan pesan kesalahan "Sumber daya ECS tidak mencukupi_OutofStock" atau "Sumber daya ECS tidak mencukupi_OperationDenied.NoStock" muncul.
Penyebab: Instance ECS dari tipe instance yang ditentukan yang ingin Anda tambahkan ke grup node tidak mencukupi.
Solusi: Lakukan operasi penskalaan keluar setelah instance ECS dari tipe instance yang ditentukan mencukupi. Atau, buat grup node yang berisi instance ECS dari tipe instance lain. Untuk informasi lebih lanjut, lihat Buat grup node.
Apa yang harus saya lakukan jika pesan kesalahan yang menunjukkan sumber daya ECS tidak mencukupi muncul saat saya membuat kluster atau grup node?
Deskripsi masalah: Kluster atau grup node gagal dibuat dan pesan kesalahan "Sumber daya ECS tidak mencukupi_OutofStock" atau "Sumber daya ECS tidak mencukupi_OperationDenied.NoStock" muncul.
Penyebab: Instance ECS dari tipe instance yang Anda pilih saat membuat kluster atau grup node tidak mencukupi.
Solusi: Pilih tipe instance ECS lain yang memiliki instance ECS mencukupi dan memenuhi kebutuhan bisnis Anda saat membuat kluster atau grup node.
Bagaimana cara menghapus layanan yang tidak lagi diperlukan?
Anda tidak dapat menghapus layanan yang ada yang diterapkan dalam kluster. Setelah layanan dimulai, Anda tidak dapat menghapus layanan tersebut di konsol atau dengan memanggil operasi API.
Bagaimana cara masuk ke node kluster?
Setelah kluster EMR dibuat, Anda dapat menggunakan kata sandi yang Anda tentukan saat membuat kluster untuk masuk ke node master kluster tersebut. Untuk informasi tentang cara masuk ke node lain dari kluster, lihat Masuk ke node lain dari kluster.
Bagaimana cara melihat vSwitch yang terkait dengan node?
Dalam Alibaba Cloud EMR pada ECS, vSwitch dikaitkan dengan node dalam grup node. Anda tidak dapat melihat asosiasi tersebut di tab Basic Information. Untuk melihat vSwitch yang terkait dengan node, lakukan langkah-langkah berikut: Pergi ke tab Nodes kluster Anda, temukan grup node tempat node tersebut milik, dan kemudian klik nama grup node. Di panel Atribut Grup Node, lihat pengaturan parameter vSwitch.
Apa yang harus saya lakukan jika kehilangan paket sering terjadi di kluster?
Deskripsi masalah: Kehilangan paket sering terjadi di kluster, dan pesan kesalahan seperti
neighbour: arp_cache: neighbor table overflow!mungkin muncul di log sistem. Ini menunjukkan bahwa tabel cache Protokol Resolusi Alamat (ARP) mencapai batas kapasitas maksimal dan tidak dapat secara efektif memetakan alamat media akses kontrol (MAC) ke alamat IP. Akibatnya, kinerja jaringan menurun.Analisis masalah: Dalam sistem terdistribusi skala besar, terutama ketika kluster EMR Anda adalah versi minor sebelum EMR V5.18.0 atau V3.52.0 dan memiliki lebih dari 1.000 server, jaringan mungkin tidak stabil dan kehilangan paket dapat terjadi. Anda dapat mengonfigurasi parameter sistem untuk mengoptimalkan manajemen cache ARP.
Tabel cache ARP menyimpan pasangan alamat MAC dan IP. Parameter terkait:
net.ipv4.neigh.default.gc_thresh1: Jika jumlah entri dalam tabel cache ARP kurang dari nilai parameter ini, pengumpul sampah tidak mengumpulkan entri. Nilai default: 128.net.ipv4.neigh.default.gc_thresh2: Jika jumlah entri dalam tabel cache ARP lebih besar dari nilai parameter ini, pengumpul sampah mengumpulkan entri dalam waktu 5 detik. Nilai default: 512.net.ipv4.neigh.default.gc_thresh3: Jumlah maksimum entri yang disimpan dalam tabel cache ARP. Nilai default: 1024.
CatatanNilai default untuk parameter tersebut kecil. Akibatnya, kehilangan paket dan ketidakstabilan jaringan terjadi ketika kluster memiliki lebih dari 1.000 server. Dalam hal ini, Anda perlu mengubah nilai default berdasarkan kebutuhan bisnis Anda.
Solusi:
Tambahkan kode berikut ke file
/etc/sysctl.confuntuk meningkatkan nilai parameter sebelumnya dan jumlah maksimum koneksi yang diizinkan masuk ke server.net.ipv4.neigh.default.gc_thresh1 = 512 net.ipv4.neigh.default.gc_thresh2 = 2048 net.ipv4.neigh.default.gc_thresh3 = 10240 net.nf_conntrack_max = 524288Jalankan perintah
sudo sysctl -puntuk membuat modifikasi berlaku.CatatanJika pesan kesalahan
sysctl: cannot stat /proc/sys/net/nf_conntrack_max: No such file or directorymuncul saat menjalankan perintahsysctl -p, Anda dapat memuat modul nf_conntrack dengan menjalankan perintahsudo modprobe nf_conntrack, lalu jalankan kembali perintahsysctl -p.
Apa yang harus saya lakukan jika peristiwa sistem ECS bernama SystemMaintenance.Redeploy terjadi?
Peristiwa SystemMaintenance.Redeploy menunjukkan bahwa Alibaba Cloud telah mendeteksi risiko potensial kegagalan perangkat lunak dan perangkat keras pada host dasar instance ECS kluster. Hal ini dapat menyebabkan instance ECS diterapkan ulang. Dalam hal ini, jangan klik Redeploy di konsol ECS untuk mencegah kehilangan data.
Solusi:
Identifikasi node tempat peristiwa terjadi berdasarkan detail peristiwa.
Tambahkan node dalam grup node tempat node bermasalah milik. Untuk informasi lebih lanjut, lihat Lakukan penskalaan keluar pada kluster EMR.
Hapus node bermasalah.
Untuk informasi tentang cara melakukan penskalaan masuk pada grup node inti atau grup node tugas berlangganan dalam kluster, ikuti petunjuk yang dijelaskan di Lakukan penskalaan masuk pada grup node.
CatatanECS menghitung dan menampilkan jumlah pengembalian dana saat Anda berhenti berlangganan instance ECS berlangganan. Jika Anda memiliki pertanyaan, submit a ticket. Pilih Elastic Compute Service (ECS) saat Anda mengirim tiket.
Untuk informasi tentang cara melakukan penskalaan masuk pada grup node tugas yang berisi instance bayar sesuai pemakaian, lihat Lakukan penskalaan masuk pada kluster.
Apa yang harus saya lakukan jika saya ingin disk instance ECS dalam kluster EMR secara otomatis mewarisi tag dari kluster EMR?
Jika Anda ingin disk instance ECS dalam kluster EMR secara otomatis mewarisi tag dari kluster EMR, Anda dapat menggunakan fitur Penandaan Sumber Daya Terkait yang disediakan oleh Resource Management. Dengan cara ini, jika Anda menempelkan disk cloud ke instance ECS, disk cloud secara otomatis mewarisi tag yang ada dari instance ECS dan juga mewarisi perubahan tag yang dibuat pada instance ECS nanti.
Prosedur:
Masuk ke Konsol Manajemen Resource.
Di bilah navigasi kiri, pilih .
Di halaman Pengaturan Tag Sumber Daya Terkait, baca deskripsi fitur dan centang kotak untuk membuat peran terkait layanan.
Saat Anda mengaktifkan fitur Penandaan Sumber Daya Terkait, sistem membuat peran terkait layanan AliyunServiceRoleForTag. Peran tersebut digunakan untuk melakukan operasi terkait tag pada sumber daya terkait. Untuk informasi lebih lanjut, lihat Peran terkait layanan untuk Tag.
Klik Enable and Configure Rules.
Di pojok kanan atas halaman Pengaturan Tag Sumber Daya Terkait, klik Edit dan konfigurasikan aturan penandaan sumber daya terkait.
Anda dapat menyetel ruang lingkup pewarisan tag untuk jenis sumber daya terkait yang berbeda ke Semua Kunci Tag atau Kunci Tag Spesifik.

Klik OK.
Untuk informasi lebih lanjut tentang fitur Penandaan Sumber Daya Terkait, lihat Gunakan fitur Penandaan Sumber Daya Terkait.
Apa yang harus saya lakukan jika pesan kesalahan IdempotentParameterMismatch muncul?
Deskripsi masalah: Pesan kesalahan berikut mungkin muncul saat Anda melepaskan kluster atau memutakhirkan konfigurasi kluster.
Penyebab: Token klien yang sama digunakan dalam beberapa permintaan.
Permintaan menggunakan token klien yang sama dengan permintaan sebelumnya, tetapi permintaannya tidak identik. Jangan gunakan kembali token klien untuk permintaan yang berbeda, kecuali permintaannya identik.Solusi: Periksa apakah Anda sedang melepaskan kluster atau memutakhirkan konfigurasi kluster. Jika Anda sedang melepaskan kluster atau memutakhirkan konfigurasi kluster, Anda tidak perlu melakukan operasi tersebut lagi. Jika Anda tidak sedang melepaskan kluster atau memutakhirkan konfigurasi kluster, segarkan halaman konsol. Kemudian, token klien baru secara otomatis dihasilkan di konsol EMR.
Apa yang harus saya lakukan jika pesan kesalahan QuotaExceeded.PrivateIpAddress muncul?
Deskripsi masalah: Pesan kesalahan berikut mungkin muncul saat Anda membuat atau melakukan penskalaan keluar kluster.
[QuotaExceeded.PrivateIpAddress] vSwitch yang ditentukan "vsw-xxxx" tidak memiliki cukup alamat IP.Penyebab: Jumlah alamat IP yang tersedia untuk vSwitch yang Anda pilih tidak mencukupi untuk pembuatan kluster atau penskalaan keluar.
Solusi: Buat grup node dan pilih vSwitch dengan alamat IP yang cukup.
Apa yang harus saya lakukan jika pesan kesalahan LostProxy muncul?
Deskripsi masalah: Pesan kesalahan "taihao-proxy disconnect" muncul saat Anda membuat kluster, melakukan penskalaan keluar kluster, atau memperbarui konfigurasi layanan.
Penyebab: Proxy EMR pada node kluster terputus.
Solusi:
Periksa status kluster dan perbaiki masalah node.
Jika sekelompok node terputus, periksa utilisasi CPU dan penggunaan memori.
Jika utilisasi CPU atau penggunaan memori tinggi, kluster kelebihan beban. Anda dapat meningkatkan konfigurasi kluster atau melakukan penskalaan keluar kluster.
Jika utilisasi CPU atau penggunaan memori rendah, periksa konfigurasi grup keamanan jaringan untuk memastikan komunikasi jaringan normal.
Jika hanya node tertentu yang terputus, periksa apakah utilisasi CPU atau penggunaan memori node mencapai 100%. Jika node kelebihan beban, periksa apakah proses abnormal menghabiskan sumber daya. Jika ada proses abnormal, hentikan proses tersebut dan periksa apakah status node menjadi normal. Jika tidak ada proses abnormal, lakukan langkah-langkah berikut:
Jika node master terputus, periksa proses dengan utilisasi CPU tinggi. Anda dapat meningkatkan spesifikasi node master atau menambahkan node Master-Extend untuk berbagi beban kerja.
Jika node non-master terputus karena beban kerja tinggi atau tidak merespons, Anda dapat melepaskan node atau menambahkan node baru.
Masuk ke node dan jalankan perintah berikut untuk memulai ulang layanan:
service taihao-proxy restart
Setelah Anda menyelesaikan langkah-langkah sebelumnya, buat kluster, lakukan penskalaan keluar kluster, atau perbarui konfigurasi layanan lagi.
Apa yang harus saya lakukan jika pesan kesalahan yang menunjukkan saldo akun tidak mencukupi muncul saat saya membuat kluster, melakukan penskalaan keluar kluster, atau memutakhirkan konfigurasi kluster?
Deskripsi masalah: Pesan kesalahan berikut muncul saat Anda membuat kluster, melakukan penskalaan keluar kluster, atau memutakhirkan konfigurasi kluster.
nvalidAccountStatus.NotEnoughBalance Pesan: Akun Anda tidak memiliki saldo yang cukup untuk memesan produk pasca bayar.Penyebab: Saldo akun Anda tidak mencukupi.
Solusi: Periksa saldo akun Anda untuk memastikan bahwa saldo akun Anda lebih besar dari biaya sumber daya yang diperlukan. Setelah memastikan bahwa saldo akun Anda mencukupi, lakukan operasi terkait lagi.
Apa yang harus saya lakukan jika pesan kesalahan QuotaExceed.DiskCapacity muncul saat saya melakukan penskalaan keluar kluster atau disk?
Deskripsi masalah: Pesan kesalahan berikut mungkin muncul saat Anda melakukan penskalaan keluar kluster atau disk.
[QuotaExceed.DiskCapacity] Kapasitas yang digunakan jenis disk telah melampaui kuota di zona, pengecekan kuota gagal.Penyebab: Kuota disk instance mencapai batas atas.
Solusi: Kapasitas yang digunakan oleh jenis disk tertentu melampaui batas kuota di zona. Anda dapat pergi ke Pusat Kuota untuk melihat dan meningkatkan kuota.
Apa yang harus saya lakukan jika pesan kesalahan QuotaExceed.DiskCapacity muncul saat saya membuat atau melakukan penskalaan keluar kluster?
Deskripsi masalah: Pesan kesalahan berikut mungkin muncul saat Anda membuat atau melakukan penskalaan keluar kluster.
QuotaExceed.ElasticQuota Pesan: Jumlah instance ECS yang ditentukan telah melampaui kuota tipe instance yang ditentukan.Penyebab: Kuota instance ECS mencapai batas atas.
Solusi: Pilih tipe instance lain atau kurangi jumlah instance yang ingin Anda buat. Anda juga dapat pergi ke konsol ECS atau Pusat Kuota untuk meminta peningkatan kuota.
Apa yang harus saya lakukan jika skrip boot gagal dieksekusi?
Lihat log eksekusi skrip boot yang gagal dieksekusi di halaman detail riwayat operasi.
Jika log berisi pesan kesalahan spesifik, modifikasi skrip boot berdasarkan pesan kesalahan dan jalankan ulang skrip tersebut.
Jika log berisi kata kunci
exitCodetanpa pesan kesalahan spesifik, tambahkan lebih banyak pernyataan logging ke skrip boot untuk debugging yang lebih baik dan jalankan ulang skrip tersebut.Jika log menunjukkan bahwa tugas habis waktu atau tidak berisi output apa pun, periksaitem berikut:
Periksa apakah Anda memiliki izin baca dan tulis pada bucket OSS tempat skrip boot disimpan.
Periksa apakah instance ECS dapat mengakses endpoint OSS internal. Lalu, jalankan ulang skrip tersebut.