Mysql
 sql >> Teknologi Basis Data >  >> RDS >> Mysql

Cara efektif untuk menghitung persentase kesamaan antara kumpulan data

Cara standar untuk melakukan ini adalah kesamaan Jaccard. Jika A adalah kumpulan tujuan dari pengguna pertama dan B adalah kumpulan tujuan dari pengguna kedua, kesamaan Jaccard adalah:

#(A intersect B)/#(A union B)

Ini adalah jumlah gol yang mereka bagikan dibagi dengan jumlah total suara yang dimiliki keduanya (menghitung gol yang mereka bagikan hanya sekali). Jadi jika pengguna pertama memiliki tujuan A={1,2,3} dan pengguna kedua memiliki tujuan B={2,4} maka ini dia:

A intersect B = {2}
A union B = {1,2,3,4}

#(A intersect B)/#(A union B) = 1/4

Kesamaan Jaccard selalu antara 0 (mereka tidak memiliki tujuan yang sama) dan 1 (mereka memiliki tujuan yang sama), jadi Anda bisa mendapatkan persentase dengan mengalikannya dengan 100.

http://en.wikipedia.org/wiki/Jaccard_index




  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Aplikasi Laravel di Azure:Akses ditolak untuk pengguna 'azure'@'localhost'

  2. Cara Mengaktifkan Operator Penggabungan Pipa di MySQL

  3. Cara mengonfigurasi kumpulan koneksi urutan Eclipselink JTA

  4. php password_verify() hash dan pass tidak akan cocok

  5. Bagaimana saya bisa menetapkan nilai ke variabel menggunakan fungsi agregat di mysql?