Saya menggunakan pendekatan serupa dengan set yang diurutkan untuk mengimplementasikan pengindeksan teks lengkap. Pendekatan keseluruhannya bagus, meskipun ada beberapa perbaikan sederhana yang bisa Anda lakukan.
- Daripada menggunakan kunci yang dibuat secara acak, Anda dapat menggunakan kueri (atau bentuk singkatnya) sebagai kunci. Itu memungkinkan Anda menggunakan kembali kumpulan yang telah dihitung, yang dapat meningkatkan kinerja secara signifikan jika Anda memiliki kueri di dua kumpulan besar yang biasanya digabungkan dengan cara yang serupa.
- Menangani judul sebagai string lengkap akan menghasilkan kumpulan anggota tunggal dalam jumlah yang sangat besar. Mungkin lebih baik untuk mengindeks setiap kata dalam judul dan memfilter hasil akhir untuk pencocokan tepat jika Anda benar-benar membutuhkannya.