Mysql
 sql >> Teknologi Basis Data >  >> RDS >> Mysql

Fungsi Jaro-winkler:mengapa skor yang sama cocok dengan kata-kata yang sangat mirip dan sangat berbeda?

Rumus jarak Jaro-Winkler bias terhadap string dengan awal yang sama. Misalnya, Valentina dan Valentiria .

Ini juga memiliki beberapa "aturan" yang tidak begitu intuitif (lihat wikipedia ).

Anda mungkin harus terlebih dahulu menentukan jenis ketidakmiripan yang Anda harapkan, dan kemudian mencari rumus jarak yang sesuai. Misalnya, dalam penulisan, "angleworm" dan "angelworm" adalah kesalahan yang sangat mungkin terjadi, jadi jarak antara dua senar harus rendah. Sementara ketidakcocokan "ada" dan "tiga" lebih kecil kemungkinannya dan "eter" bahkan lebih. Dengan anagram yang lebih panjang, jarak Jaro mungkin persis sama, dan bahkan koreksi Winkler mungkin tidak akan berhasil.

Seperti yang dapat Anda baca di halaman ini (penekanan pada saya)



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. kode php untuk menguji pdo tersedia?

  2. Kueri SQL dengan bergabung untuk mendapatkan array objek bersarang

  3. Cara menghitung item dalam daftar yang dipisahkan koma MySQL

  4. Transaksi MySQL dengan aplikasi akuntansi

  5. MySQL, json, JSON_ARRAY_APPEND - mengapa append tidak berfungsi pada 5.7.13?