Общ преглед
Булевият модел е прост модел за извличане, базиран на теорията на агрегацията и булевата алгебра. Характеризира се с намиране на документи, които са "верни", които се връщат към термин на заявка. В този модел терминът на заявка е булев израз, включително ключови думи и логически оператори. Чрез булеви изрази могат да бъдат изразени характеристиките на потребителя, които искат документацията. Тъй като дефиницията на колекцията е много интуитивна, булевият модел предоставя на потребителя система за извличане на информация, лесна за овладяване на рамката. Низът на заявката обикновено се въвежда в семантичен и точен булев израз.
Дефект
Първо, неговата стратегия за извличане се основава на бинарен критерий за вземане на решение (например, един документ е само свързан и несвързан два) Статус), липсва концепцията за оценка на документа (RANK), ограничавайки функция за търсене.
Второ, въпреки че булевият израз има точна семантика, често е трудно да се преобразува търсенето на информация на потребителя в булев израз. Всъщност повечето потребители на извличане са открили, че информацията за заявката се обменя, от която се нуждаят. Не е толкова лесно за Boolean.
Отстранете горните дефекти, булевият модел все още е основният модел в системата за база данни с документи.
Булевият модел определя дали операцията на индекса е само две състояния, или има или не се появява в един документ, така че теглото на члена на индекса се изразява като двоично (например,). Низът на заявката Q е традиционен булев израз. Приема се, че е формата на разделяне на q. Предполага се, че е дефиниран от всеки формуляр за разделяне, документът се дефинира като:
ако булевият модел представлява документ, свързан с низа на заявката (но може да не принадлежи към набора от резултати на заявката), в противен случай това означава, че не е свързан с документа. Основното предимство на
Булевият модел трябва да има ясни и прости форми, докато основните дефекти са напълно съвпадащи, за да причинят връщането на твърде много или твърде малко резултатен документ. Добре известно е, че тежестта на термина на индекса фундаментално подобрява функцията на системата за извличане, което води до производството на векторни модели.