Mysql
 sql >> Teknologi Basis Data >  >> RDS >> Mysql

Buat Spark Dataframe dari SQL Query

Saya menemukan ini di sini Migrasi data massal melalui Spark SQL

Parameter dbname dapat berupa kueri apa pun yang dibungkus dalam tanda kurung dengan alias. Jadi dalam kasus saya, saya perlu melakukan ini:

val query = """
  (select dl.DialogLineID, dlwim.Sequence, wi.WordRootID from Dialog as d
    join DialogLine as dl on dl.DialogID=d.DialogID
    join DialogLineWordInstanceMatch as dlwim on dlwim.DialogLineID=dl.DialogLineID
    join WordInstance as wi on wi.WordInstanceID=dlwim.WordInstanceID
    join WordRoot as wr on wr.WordRootID=wi.WordRootID
    where d.InSite=1 and dl.Active=1
    limit 100) foo
"""

val df = sqlContext.format("jdbc").
  option("url", "jdbc:mysql://localhost:3306/local_content").
  option("driver", "com.mysql.jdbc.Driver").
  option("useUnicode", "true").
  option("continueBatchOnError","true").
  option("useSSL", "false").
  option("user", "root").
  option("password", "").
  option("dbtable",query).
  load()

Seperti yang diharapkan, memuat setiap tabel sebagai Dataframe-nya sendiri dan menggabungkannya di Spark sangat tidak efisien.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. PHP 7.0 dan kesalahan start-up MySQL simbol tidak terdefinisi:mysqlnd_allocator in Unknown

  2. Perbandingan Administrasi Dasar Antara Oracle, MSSQL, MySQL, PostgreSQL

  3. Bagaimana tabel innodb dikunci saat pemicu ON INSERT diproses?

  4. Bagaimana melakukan time_to_minute di Mysql?

  5. Cara terbaik untuk menyimpan Pengaturan Aplikasi PHP?