Mysql
 sql >> Teknologi Basis Data >  >> RDS >> Mysql

Relevansi pencarian teks lengkap diukur dalam?

Struktur data dasar untuk sistem pencarian teks adalah Indeks Terbalik . Ini pada dasarnya adalah daftar kata yang ditemukan dalam kumpulan dokumen dengan daftar dokumen tempat kata tersebut muncul. Ini juga dapat memiliki metadata tentang kemunculan setiap dokumen, seperti berapa kali kata tersebut muncul.

Dokumen yang berisi kata-kata dapat ditanyakan dengan mencocokkan pada istilah pencarian. Untuk menentukan relevansi, heuristik yang dikenal sebagai Peringkat Kosinus dihitung pada hit. Ini bekerja dengan membangun vektor n-dimensi dengan satu komponen untuk masing-masing n istilah pencarian. Anda juga dapat menimbang istilah pencarian jika diinginkan. Vektor ini memberikan titik dalam ruang n-dimensi yang sesuai dengan istilah penelusuran Anda.

Vektor serupa berdasarkan kemunculan berbobot di setiap dokumen dapat dibangun dari indeks terbalik dengan setiap sumbu dalam vektor yang sesuai dengan sumbu untuk setiap istilah pencarian. Jika Anda menghitung produk titik dari vektor-vektor ini, Anda mendapatkan kosinus dari sudut di antara mereka. 1.0 setara dengan cos (0), yang akan mengasumsikan vektor menempati garis yang sama dari titik asal. Semakin dekat vektornya, semakin kecil sudutnya dan semakin dekat kosinusnya dengan 1,0.

Jika Anda mengurutkan hasil pencarian berdasarkan kosinus (atau memasukkannya ke dalam antrian prioritas sebagai mg tidak) Anda mendapatkan yang paling relevan. Algoritme relevansi yang lebih cerdik cenderung mengutak-atik bobot istilah penelusuran, mencondongkan produk titik ke istilah dengan relevansi tinggi.

Jika Anda ingin menggali sedikit, Mengelola Gigabytes oleh Bell dan Moffet membahas arsitektur internal sistem pencarian teks.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. MySQL memicu sintaks 'perbarui pada kolom'

  2. Cara Membuat Script dari Diagram di MySQL Workbench

  3. Cara Mendapatkan Jumlah Hari dalam Sebulan di MySQL

  4. Cara membatasi upaya login - PHP &MySQL &CodeIgniter

  5. Memilih semua item dalam satu tabel dan bergabung dengan tabel lain, memungkinkan nulls