PostgreSQL
 sql >> Teknologi Basis Data >  >> RDS >> PostgreSQL

Pyspark:Hapus karakter null UTF dari kerangka data pyspark

Ah tunggu - saya pikir saya memilikinya. Jika saya melakukan sesuatu seperti ini, sepertinya berhasil:

null = u'\u0000'
new_df = df.withColumn('e', regexp_replace(df['e'], null, ''))

Dan kemudian memetakan ke semua kolom string:

string_columns = ['d','e']
new_df = df.select(
  *(regexp_replace(col(c), null, '').alias(c) if c in string_columns else c for
    c in df.columns)
  )


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Menggunakan alat hibernasi untuk merekayasa balik pojo dari Postgres

  2. PostgreSQL tidak dapat memulai/mengakhiri transaksi di PL/pgSQL

  3. Cara sederhana untuk mereset basis data Django PostgreSQL?

  4. Bagaimana cara menyimpan JS Date.now() di PostgreSQL?

  5. Bagaimana cara menggunakan SQLAlchemy untuk mengakses banyak database dengan mulus?