Веб-приложение (ветка main
), является реализацией тестового задания, позволяет пользователю загрузить текстовый файл для осуществления его анализа. После загрузки файла приложение вычисляет и отображает статистику по 50 наиболее употребляемым словам в тексте, включая их частоту (TF) и обратную частоту документа (IDF). Результаты анализа представляются в виде таблицы. Веб-приложение не проводит морфологический анализ слов документа, для их приведения к базовой форме, а также не позволяет осуществлять корректный расчет IDF в следствии своей ограничености. Данные требования могут быть реализованы в дальнейшем (ветка future
) при получении более конкретного ТЗ.
- Загрузка текстового файла через веб-интерфейс.
- Анализ текста с расчетом TF и IDF для каждого слова (IDF расчитывается исходя из размера коллекции в 1 файл!).
- Отображение таблицы с 50 наиболее часто встречающимися слов в предоставленном тексте.