Maaf jose mendengar Anda mengalami masalah dengan konektor.
Informasi mengenai partisi dapat ditemukan di situs dokumentasi konektor Spark . Harap ajukan tiket di proyek jira Dokumen jika Anda merasa ada yang hilang atau tidak jelas, itu benar-benar dapat membantu pengguna di masa mendatang!
Partisi default adalah pembungkus tipis di sekitar MongoSamplePartitioner
. Ini membagi koleksi menjadi partisi berukuran berdasarkan pengambilan sampel statistik dari koleksi.
MongoShardedPartitioner
menggunakan shardKey
untuk menghasilkan partisi. Secara default akan menggunakan _id
sebagai kunci. Anda mungkin perlu mengonfigurasi nilai tersebut.
Catatan: Shardkey yang di-hash bukan didukung oleh MongoShardedPartitioner
karena saat ini tidak ada cara untuk menanyakan koleksi terhadap nilai hash - jadi ketika mengambil partisi akan gagal mengembalikan hasil. Saya telah menambahkan DOCS-12345
untuk memperbarui dokumentasi.
Sepertinya ada masalah dalam pengaturan Anda di mana MongoShardedPartitioner
gagal mempartisi koleksi seperti yang diharapkan dan mengembalikan 0 hasil. Inferensi skema akan tetap berfungsi karena cara menanyakan koleksi. Jika ini bukan masalah konfigurasi / hash shardkey maka masalah, harap laporkan bug di proyek Spark jira dan saya dapat membantu mengidentifikasi penyebabnya dan memberikan solusi untuk Anda.