PostgreSQL
 sql >> Teknologi Basis Data >  >> RDS >> PostgreSQL

Menggunakan pyspark untuk terhubung ke PostgreSQL

Unduh Driver JDBC PostgreSQL dari https://jdbc.postgresql.org/download.html

Kemudian ganti nilai konfigurasi database dengan milik Anda.

from pyspark.sql import SparkSession

spark = SparkSession \
    .builder \
    .appName("Python Spark SQL basic example") \
    .config("spark.jars", "/path_to_postgresDriver/postgresql-42.2.5.jar") \
    .getOrCreate()

df = spark.read \
    .format("jdbc") \
    .option("url", "jdbc:postgresql://localhost:5432/databasename") \
    .option("dbtable", "tablename") \
    .option("user", "username") \
    .option("password", "password") \
    .option("driver", "org.postgresql.Driver") \
    .load()

df.printSchema()

Info lebih lanjut:https://spark.Apache.org/docs/latest/sql-data-sources-jdbc.html



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Fungsi jendela dan lebih banyak agregasi lokal

  2. Kontainer Spring Docker tidak dapat mengakses kontainer Postgres Docker

  3. PG::UndefinedTable:ERROR:relasi tidak ada dengan penamaan dan konvensi Rails yang benar

  4. Spring Data JPA Auditing tidak berfungsi untuk metode pembaruan JpaRepository dengan anotasi @Modifying, mengapa?

  5. Partisi Replikasi Logis Dengan PostgreSQL 13