MongoDB
 sql >> Teknologi Basis Data >  >> NoSQL >> MongoDB

Bagaimana cara menghapus tweet kosong menggunakan filter() di pyspark?

Jika data Anda seperti ini

tweets = sc.parallelize(["title1", "", "title2", "title3", ""])

anda dapat menggunakan len(x) sebagai kondisi filter:

tweets.filter(lambda x: len(x) > 0).count()



  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Reactivemongo membuat serial peta menjadi BSONDocument

  2. Redis atau Mongo untuk menentukan apakah suatu angka termasuk dalam rentang?

  3. Bagaimana cara mendapatkan 5 dokumen terakhir secara berurutan?

  4. Sisipan MongoDB Banyak ()

  5. 5 Cara Memilih Baris dengan Nilai Maksimum untuk Grupnya di SQL