Mysql
 sql >> Teknologi Basis Data >  >> RDS >> Mysql

Spark:Membaca tabel MySQL besar ke DataFrame gagal

Spark JDBC API tampaknya bercabang untuk memuat semua data dari tabel MySQL ke memori tanpa. Jadi ketika Anda mencoba memuat tabel besar, yang harus Anda lakukan adalah menggunakan data clone Spark API ke HDFS terlebih dahulu (JSON harus digunakan untuk menjaga struktur skema), seperti ini:

spark.read.jdbc(jdbcUrl, tableName, prop)
       .write()
       .json("/fileName.json");

Kemudian Anda dapat mengerjakan HDFS secara normal.

spark.read().json("/fileName.json")
       .createOrReplaceTempView(tableName);



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Mysql - pilih id yang cocok dengan semua tag

  2. mysql tinyint(1) vs tinyint(2) vs tinyint(3) vs tinyint(4)

  3. SQL CREATE DATABASE Syntax – Didaftarkan oleh DBMS

  4. Pemicu MySQL untuk memperbarui bidang berdasarkan jumlah kolom dari tabel lain

  5. Bisakah kita Mengeksekusi Query SQL di JQuery?