Mysql
 sql >> Teknologi Basis Data >  >> RDS >> Mysql

Siapkan database besar di MySQL untuk analisis di R

Dokumentasi untuk RMySQL cukup bagus - tetapi ini mengasumsikan bahwa Anda mengetahui dasar-dasar SQL. Ini adalah:

  • membuat database
  • membuat tabel
  • memasukkan data ke dalam tabel
  • mengeluarkan data dari tabel

Langkah 1 mudah:di konsol MySQL, cukup "buat database DBNAME". Atau dari baris perintah, gunakan mysqladmin , atau sering ada GUI admin MySQL.

Langkah 2 sedikit lebih sulit, karena Anda harus menentukan bidang tabel dan jenisnya. Ini akan tergantung pada konten file CSV Anda (atau dibatasi lainnya). Contoh sederhana akan terlihat seperti:

use DBNAME;
create table mydata(
  id INT(11) NOT NULL AUTO_INCREMENT PRIMARY KEY,
  height FLOAT(3,2)
); 

Yang mengatakan buat tabel dengan 2 bidang:id , yang akan menjadi kunci utama (jadi harus unik) dan akan bertambah secara otomatis saat catatan baru ditambahkan; dan tinggi , yang di sini ditentukan sebagai float (tipe numerik), dengan total 3 digit dan 2 setelah titik desimal (mis. 100.27). Anda harus memahami tipe data .

Langkah 3 - ada berbagai cara untuk mengimpor data ke tabel. Salah satu yang paling mudah adalah dengan menggunakan mysqlimport kegunaan. Pada contoh di atas, dengan asumsi bahwa data Anda berada dalam file dengan nama yang sama dengan tabel (mydata), kolom pertama adalah karakter tab dan yang kedua adalah variabel tinggi (tanpa baris header), ini akan berfungsi:

mysqlimport -u DBUSERNAME -pDBPASSWORD DBNAME mydata

Langkah 4 - mengharuskan Anda mengetahui cara menjalankan kueri MySQL. Sekali lagi, contoh sederhana:

select * from mydata where height > 50;

Berarti "ambil semua baris (id + tinggi) dari tabel mydata yang tingginya lebih dari 50".

Setelah menguasai dasar-dasar tersebut, Anda dapat beralih ke contoh yang lebih kompleks seperti membuat 2 tabel atau lebih dan menjalankan kueri yang menggabungkan data dari masing-masing tabel.

Kemudian - Anda dapat beralih ke manual RMySQL. Di RMySQL, Anda mengatur koneksi database, lalu menggunakan sintaks kueri SQL untuk mengembalikan baris dari tabel sebagai bingkai data. Jadi sangat penting bagi Anda untuk mendapatkan bagian SQL - bagian RMySQL itu mudah.

Ada banyak tutorial MySQL dan SQL di web, termasuk "resmi" tutorial di situs MySQL. Cukup telusuri "tutorial mysql" di Google.

Secara pribadi, saya tidak menganggap 80 Mb sebagai kumpulan data yang besar sama sekali; Saya terkejut bahwa ini menyebabkan masalah RAM dan saya yakin fungsi R asli dapat menanganinya dengan mudah. Tapi bagus untuk mempelajari keterampilan baru seperti SQL, bahkan jika Anda tidak membutuhkannya untuk masalah ini.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Bagaimana menemukan tabel terbesar di database MySQL?

  2. Perbarui total berdasarkan baris saldo sebelumnya

  3. Cara Menemukan Nama Kendala di MySQL

  4. Izinkan karakter non ascii di database MySQL

  5. Bagaimana saya bisa Menyisipkan banyak baris ke dalam tabel MySQL dan mengembalikan ID baru?