PostgreSQL
 sql >> Teknologi Basis Data >  >> RDS >> PostgreSQL

Koneksi Pyspark ke database Postgres di notebook ipython

Saya tidak yakin mengapa jawaban di atas tidak berhasil untuk saya, tetapi saya pikir saya juga dapat membagikan apa yang sebenarnya berhasil bagi saya ketika menjalankan pyspark dari notebook jupyter (Spark 2.3.1 - Python 3.6.3):

from pyspark.sql import SparkSession
spark = SparkSession.builder.config('spark.driver.extraClassPath', '/path/to/postgresql.jar').getOrCreate()
url = 'jdbc:postgresql://host/dbname'
properties = {'user': 'username', 'password': 'pwd'}
df = spark.read.jdbc(url=url, table='tablename', properties=properties)


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Postgres:PILIH nama kolom berdasarkan nilai Boolean

  2. Bisakah batasan AWAL DEFERRED didefinisikan menggunakan anotasi Hibernate?

  3. PostgreSQL:ERROR:operator tidak ada:integer =karakter bervariasi

  4. Postgres Periksa apakah IP (inet) DALAM daftar Rentang IP

  5. Django tidak dapat terhubung ke RDS postgresql