Это репозиторий курса "Компьютерная лингвистика", читаемого в ВВГУ весной 2023
Лекция 1 - Библиотека requests, загрузка файлов из сети.
Лекция 2 - Основные этапы обработки текстов.
Лекция 3 - Выделение неоднословных терминов из текстов.
Лекция 4 - Синтаксический анализ текстов.
Лекция 5 - Сокращение размерности пространства признаков.
Лекция 6 - Тематическое моделирование.
Лекция 7 - Векторизация текстов.
Лекция 8 - Снятие омонимии.
Дополнительные материалы 1 - Кластеризация.
Дополнительные материалы 2 - Откуда берется доверительный интервал и как понять, что надо больше экспериментальных данных.