MongoDB
 sql >> Teknologi Basis Data >  >> NoSQL >> MongoDB

cara menyimpan data yang diproses dari hdfs menggunakan mapReduce di mongoDB sebagai output

Pada dasarnya yang Anda butuhkan adalah mengubah "kelas format output", dan Anda memiliki beberapa cara di sana:

  1. Gunakan Konektor MongoDB untuk Hadoop :http://docs.mongodb.org/ecosystem/tools /hadoop/?_ga=1.111209414.370990604.1441913822
  2. Terapkan OutputFormat Anda sendiri :https://hadoop. apache.org/docs/r2.7.0/api/org/Apache/hadoop/mapred/OutputFormat.html (Alih-alih menggunakan FileOutputFormat).
  3. Jalankan kueri mongodb di dalam peredam alih-alih menulis dalam konteks MapREduce (Tidak Bagus, Anda dapat mengakhiri dengan file keluaran kosong di HDFS tergantung pada OutputFormat yang ditentukan dalam driver)

Menurut pendapat saya opsi 1 adalah opsi terbaik tetapi saya belum pernah menggunakan konektor MongoDB untuk mengatakan apakah itu cukup stabil dan fungsional. Opsi 2 mengharuskan Anda benar-benar memahami cara kerja hadoop underhood untuk menghindari akhir dengan banyak koneksi terbuka dan masalah dengan transaksi dan percobaan ulang tugas hadoop.




  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. MongoDB - Proyeksikan hanya elemen yang cocok dalam array

  2. Kueri agregat MongoDb bergabung dengan dua koleksi

  3. Apakah saya perlu membersihkan input pengguna sebelum memasukkan MongoDB (kombo MongoDB + Node js)

  4. Luwak mengembalikan [Objek] alih-alih dokumen tertanam yang sebenarnya

  5. cari dalam kombinasi dua bidang di Mongodb