PostgreSQL
 sql >> Teknologi Basis Data >  >> RDS >> PostgreSQL

Tidak dapat terhubung ke postgres menggunakan jdbc di pyspark Shell

Semoga bermanfaat.

Di lingkungan saya SPARK_CLASSPATH berisi jalur ke konektor postgresql

from pyspark import SparkContext, SparkConf
from pyspark.sql import DataFrameReader, SQLContext
import os

sparkClassPath = os.getenv('SPARK_CLASSPATH', '/path/to/connector/postgresql-42.1.4.jar')

# Populate configuration
conf = SparkConf()
conf.setAppName('application')
conf.set('spark.jars', 'file:%s' % sparkClassPath)
conf.set('spark.executor.extraClassPath', sparkClassPath)
conf.set('spark.driver.extraClassPath', sparkClassPath)
# Uncomment line below and modify ip address if you need to use cluster on different IP address
#conf.set('spark.master', 'spark://127.0.0.1:7077')

sc = SparkContext(conf=conf)
sqlContext = SQLContext(sc)

url = 'postgresql://127.0.0.1:5432/postgresql'
properties = {'user':'username', 'password':'password'}

df = DataFrameReader(sqlContext).jdbc(url='jdbc:%s' % url, table='tablename', properties=properties)

df.printSchema()
df.show()

Sepotong kode ini memungkinkan untuk menggunakan pyspark di tempat yang Anda butuhkan. Sebagai contoh, saya telah menggunakannya dalam proyek Django.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Tuple tidak dimasukkan secara berurutan dalam tabel database?

  2. Kembalikan Nilai Non-Numerik dari Kolom Database PostgreSQL

  3. Bagaimana mencegah penghapusan baris pertama dalam tabel (PostgreSQL)?

  4. Parameter konfigurasi work_mem di PostgreSQL di Linux

  5. Apakah Postgres mendukung transaksi bersarang atau otonom?