/NLP_VVSU_2023

Это репозиторий курса "Компьютерная лингвистика", читаемого в ВВГУ весной 2023

Primary LanguageJupyter NotebookCreative Commons Zero v1.0 UniversalCC0-1.0

NLP_VVSU_2023

Это репозиторий курса "Компьютерная лингвистика", читаемого в ВВГУ весной 2023

Лекция 1 - Библиотека requests, загрузка файлов из сети.

Лекция 2 - Основные этапы обработки текстов.

Лекция 3 - Выделение неоднословных терминов из текстов.

Лекция 4 - Синтаксический анализ текстов.

Лекция 5 - Сокращение размерности пространства признаков.

Лекция 6 - Тематическое моделирование.

Лекция 7 - Векторизация текстов.

Лекция 8 - Снятие омонимии.

Дополнительные материалы 1 - Кластеризация.

Дополнительные материалы 2 - Откуда берется доверительный интервал и как понять, что надо больше экспериментальных данных.