Mysql
 sql >> Teknologi Basis Data >  >> RDS >> Mysql

Dapatkan bidang serupa yang paling sering diulang di database MySQL

Apa yang Anda bicarakan adalah proses pengelompokan teks. Anda mencoba menemukan potongan teks yang serupa, dan secara sewenang-wenang memilih salah satunya. Saya tidak familiar dengan database yang melakukan bentuk text mining ini.

Untuk apa yang Anda gambarkan, teknik penambangan teks yang cukup mendasar mungkin akan berhasil. Buat matriks istilah-dokumen dengan semua kata kecuali nama pengguna. Kemudian gunakan dekomposisi nilai singular untuk mendapatkan nilai singular dan vektor terbesar (ini adalah komponen utama pertama dari matriks korelasi). Kegiatan serupa harus mengelompok di sepanjang garis ini.

Jika Anda memiliki kosakata terbatas dan memiliki istilah dalam tabel, Anda dapat mengukur jarak antara dua tindakan dengan proporsi kata yang tumpang tindih. Apakah Anda memiliki daftar semua kata dalam tindakan?



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Tidak dapat mengambil data Unicode dalam bahasa Hindi dari PHP dan MySQL

  2. Java:com.mysql.jdbc.exceptions.jdbc4.MySQLNonTransientConnectionException:Tidak dapat membuat koneksi ke server database

  3. Debug PDO mySql masukkan NULL ke dalam database alih-alih kosong

  4. Temukan nilai paling sering di kolom SQL

  5. Jelaskan rencana dalam kinerja mysql menggunakan Menggunakan sementara; Menggunakan filesort; Menggunakan kondisi indeks