/Search_server

Реализация поисковой системы документов.

Primary LanguageC++

Search_server

Search_server - поисковик документов с учётом минус-слов(документы с этими словами не будут отображаться в результатах поисков). Работает на подобии поисковиков, такой как Яндекс. Ранжирование результатов происходит по TF-IDF.

Описание

Основной сущностью представляющей документ является структура Document, которая содержит уникальный номер документа, его релевантность и рейтинг. На данный момент добавление документов в основную базу происходит через main.cpp.

  • Для реализации многопоточного поиска был разработан класс ConcurrentMap.
  • Для разделения результатов поиска на странички разработан класс Paginator
  • Для поиска и удаления дубликатов документов в базе реализована функция RemoveDuplicates

Сборка

С помощью CMake собрать файл CMakeLists.txt, который находится в папке src.

Требования

  • C++17 и выше