Mysql
 sql >> Teknologi Basis Data >  >> RDS >> Mysql

mySQL:Menggunakan jarak Levenshtein untuk menemukan duplikat dalam 20.000 baris

Saya tahu setidaknya satu pengoptimalan yang dapat memotong waktu berjalan menjadi dua:

AND a.id < b.id

Ini mencegah Anda menguji a=1, b=2 saat Anda telah menguji a=2, b=1.

Ini masih akan menjadi O(n^2), tapi saya tidak bisa melihat bagaimana Anda bisa berbuat banyak tentang itu.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Panduan untuk memahami pola penskalaan basis data

  2. 'ER_PARSE_ERROR' pada node mysql saat memasukkan beberapa nilai

  3. cara menyimpan bahasa India seperti Telugu, Hindi di database mysql

  4. Lebih dari 60 detik atau menit dalam file impor MySQL

  5. MIN() – Temukan Nilai Minimum dalam Kolom di MySQL