Jika Anda ingin memodifikasi (menghapus catatan) sumber data aktual yaitu tabel di postgres, maka Spark tidak akan menjadi cara yang bagus. Anda dapat menggunakan klien jdbc secara langsung untuk mencapai hal yang sama.
Jika Anda tetap ingin melakukan ini (secara terdistribusi berdasarkan beberapa petunjuk yang Anda hitung sebagai bagian dari kerangka data); Anda dapat memiliki kode klien jdbc yang sama yang ditulis dalam korespondensi dengan kerangka data yang memiliki info logika/pemicu untuk menghapus catatan dan yang dapat kami jalankan pada banyak pekerja secara paralel.