Topik ini menjelaskan istilah dasar dari MapReduce.
Map/Reduce
Saat tugas map atau reduce dijalankan, metode setup(), map() atau reduce(), dan cleanup() dipanggil. Metode setup() dipanggil sebelum metode map() atau reduce(), dan setiap pekerja hanya memanggilnya sekali.
Metode cleanup() dipanggil setelah metode map() atau reduce(), dan setiap pekerja hanya memanggilnya sekali.
Untuk informasi lebih lanjut tentang contoh penggunaan, lihat Program contoh.
Urutkan
Beberapa kolom dalam catatan kunci yang dihasilkan oleh mapper dapat digunakan sebagai kolom pengurutan. Kolom-kolom ini tidak mendukung komparator kustom. Anda dapat memilih beberapa kolom pengurutan sebagai kolom grup, namun kolom-kolom tersebut juga tidak mendukung komparator grup kustom. Kolom pengurutan digunakan untuk mengurutkan data, sedangkan kolom grup digunakan untuk pengurutan sekunder.
Untuk informasi lebih lanjut tentang contoh penggunaan, lihat Kode sumber pengurutan sekunder.
Partisi
MaxCompute mendukung kolom partisi dan pemartisi kustom. Kolom partisi memiliki prioritas lebih tinggi dibandingkan pemartisi kustom.
Pemartisi digunakan untuk mengalokasikan data yang dihasilkan oleh mapper ke reducer yang berbeda berdasarkan logika partisi.
Penggabung
Fungsi penggabung menggabungkan catatan yang berdekatan pada tahap shuffle. Anda dapat menentukan apakah akan menggunakan fungsi penggabung berdasarkan logika bisnis Anda.
Fungsi penggabung merupakan optimasi dari kerangka komputasi MapReduce. Logika penggabung sama dengan logika reducer. Setelah mapper menghasilkan data, kerangka kerja menggabungkan data dengan kunci yang sama pada tahap map.
Untuk informasi lebih lanjut tentang contoh penggunaan, lihat Program contoh.