Ambil daftar kata berhenti (non-kata kunci) dari sini, orang itu bahkan telah memformatnya dalam php untuk Anda.http://armandbrahaj.blog.al/2009/04/14/list-of-english-stop-words/
Kemudian lakukan preg_replace pada string yang Anda indeks.
Apa yang saya lakukan di masa lalu adalah menghapus sufiks seperti 's', 'ed' dll dengan regex dan menggunakan regex yang sama pada string pencarian. Itu tidak ideal. Ini untuk situs web dasar dengan hanya 200 halaman.
Jika Anda khawatir tentang kinerja, Anda mungkin ingin mempertimbangkan untuk menggunakan mesin pencari seperti Lucine (solr) daripada database. Ini akan membuat pengindeksan lebih mudah. Anda tidak ingin menemukan kembali roda di sini.