Setiap pengujian yang saya jalankan secara pribadi (termasuk menggunakan data Anda sendiri) menunjukkan kerangka kerja agregasi menjadi kelipatan lebih cepat daripada pengurangan peta, dan biasanya urutan besarnya lebih cepat.
Hanya mengambil 1/10 dari data yang Anda posting (tetapi daripada membersihkan cache OS, menghangatkan cache terlebih dahulu - karena saya ingin mengukur kinerja agregasi, dan bukan berapa lama waktu yang dibutuhkan untuk halaman dalam data) saya mendapatkan ini:
MapReduce:1.058 md
Kerangka Kerja Agregasi:133 md
Menghapus $match dari kerangka kerja agregasi dan {query:} dari mapReduce (karena keduanya hanya akan menggunakan indeks dan bukan itu yang ingin kami ukur) dan mengelompokkan seluruh kumpulan data berdasarkan key2 yang saya dapatkan:
MapReduce:18.803 md
Kerangka Kerja Agregasi:1,535 md
Itu sangat sejalan dengan eksperimen saya sebelumnya.