Jawaban saya didasarkan pada pengetahuan dan pengalaman Hadoop MR dan pembelajaran Mongo DB MR. Mari kita lihat apa perbedaan utama dan kemudian coba tentukan kriteria seleksi:Perbedaannya adalah:
- MR Hadoop dapat ditulis dalam Java, sedangkan MongoDB dalam JavaScript.
- MR Hadoop mampu memanfaatkan semua inti, sedangkan MongoDB adalah thread tunggal.
- Hadoop MR tidak akan ditempatkan bersama data, sedangkan DB Mongo akan ditempatkan.
- Hadoop MR memiliki jutaan mesin/jam dan dapat mengatasi banyak kasus sudut dengan ukuran besar keluaran, kemiringan data, dll
- Ada kerangka kerja tingkat yang lebih tinggi seperti Pig, Hive, Cascading yang dibangun di atas mesin Hadoop MR.
- Hadoop MR adalah arus utama dan banyak dukungan komunitas tersedia.
Dari hal di atas saya dapat menyarankan kriteria pemilihan berikut:
Pilih Mongo DB MR jika Anda membutuhkan pengelompokan sederhana dan penyaringan, jangan berharap pengocokan berat antara peta dan pengurangan. Dengan kata lain - sesuatu yang sederhana.
Pilih hadoop MR jika Anda akan melakukan pekerjaan MR yang rumit dan intens secara komputasi (misalnya beberapa perhitungan regresi). Memiliki banyak atau ukuran data yang tidak dapat diprediksi antara peta dan pengurangan juga menyarankan Hadoop MR.
Java adalah bahasa yang lebih kuat dengan lebih banyak perpustakaan, terutama statistik. Itu harus diperhitungkan.