Idenya adalah bahwa Anda meningkatkan kinerja kueri agregasi dengan menggunakan MapReduce pada database sharded yang didistribusikan melalui beberapa mesin.
Saya melakukan beberapa perbandingan kinerja Mongo's Mapreduce dengan pernyataan kelompok demi pilihan di Oracle pada mesin yang sama. Saya memang menemukan bahwa Mongo kira-kira 25 kali lebih lambat. Ini berarti bahwa saya harus melakukan sharding data pada setidaknya 25 mesin untuk mendapatkan kinerja yang sama dengan Mongo seperti yang diberikan Oracle pada satu mesin. Saya menggunakan koleksi/tabel dengan sekitar 14 juta dokumen/baris.
Mengekspor data dari mongo melalui mongoexport.exe dan menggunakan data yang diekspor sebagai tabel eksternal di Oracle dan melakukan group-by di Oracle jauh lebih cepat daripada menggunakan MapReduce milik Mongo sendiri.