Pencocokan nama itu sulit . Pengindeksan Teks Oracle mendukung pencocokan fuzzy dan stemming, yang merupakan permulaan, tetapi pertimbangkan nama-nama ini:
- Nicholas Raleigh
- Nihcolas Raleigh
- Nico Raleigh
- Nik Raleigh
- Nicky Raleigh
- Nick Raleigh
- Nikolaus Raleigh
- Nicola Raleigh
- Nikki Raleigh
- Nikola Raleigh
- Nikolai Raleigh
- Nikolaj Raleigh
Mencoba mencocokkannya melalui abstraksi, baik itu Levenshtein Distance atau Double Metaphone, akan menghasilkan positif palsu dan negatif palsu. Ini adalah sifat abstraksi. Cara terbaik untuk mendapatkan hasil yang terfokus dan akurat adalah dengan tesaurus (dan bahkan ini tidak sempurna). Sayangnya, menyusun tesaurus nama yang komprehensif adalah pekerjaan besar; untuk memahami tugas, periksa statistik di situs NameX .
Pembaruan:Oracle 11gR2 menyertakan ekstensi ke Oracle Text yang disesuaikan dengan pencarian nama. Ini sangat rapi, dan jelas merupakan tempat pertama untuk memulai. Cari tahu lebih lanjut .