jar3b/py-phias

По релевантности

Closed this issue · 1 comments

jar3b commented

-Можно убрать стемминг с основы - отсечем словоформы, которые мы итак можем найти предварительно. Этот же стемминг добавить в малый индекс.
-Еще нужно сделать так, чтобы слово не бустило рейтинг, если оно несколько раз встретилось. Всякие там MAYBE не дают решения.
-Как вариант, смотреть где находится слово:

  1. Если рядом слово и сокращение - объединять
  2. Последнее слово искать ближе к концу (улицы там, пункты)
jar3b commented

Реализовано