itu mungkin berhasil, tetapi mungkin ada kecocokan palsu, tanpa cara untuk mencegahnya, karena Anda hanya memiliki solusi algoritme. Taruhan terbaik Anda adalah membuat tabel alias. Sertakan setiap variasi yang pernah ditemukan untuk setiap nama perusahaan dan FK ke ID perusahaan yang sebenarnya. Sertakan juga baris untuk nama sebenarnya.
AliasID CompanyID CompanyAlias
------- --------- ------------
1 1 Company X, Inc <<--actual real company name
2 1 Company X Inc
3 1 Company X
Jika kecocokan nama yang tepat tidak ditemukan dalam tabel ini saat mengimpor data, Anda dapat menggunakan algoritme yang Anda usulkan atau yang lain, atau menggunakan input manusia, dll untuk menemukan kecocokan atau menghasilkan perusahaan baru. Kemudian masukkan ke tabel alias. Jika Anda menemukan bahwa kecocokan Anda salah karena suatu alasan, Anda dapat mengubah tabel alias untuk membuat pemetaan yang tepat. Jika Anda hanya menggunakan algoritme, Anda harus menyertakan pengecualian dan algoritme Anda akan tumbuh besar dan lambat. Dengan tabel ini dan indeks yang bagus, menemukan kecocokan Anda akan lebih cepat.