/NLP_VVSU_2022

Natural Language Processing course 2022

Primary LanguageJupyter NotebookGNU General Public License v3.0GPL-3.0

Материал по курсу "Компьютерная лингвистика-2022"

Лекция 1, часть 1 Регулярные выражения.
Лекция 1, часть 2 Библиотеки requests, BeautyfulSoup, lxml+XPath.
Лекция 1, часть 3 Основные этапы обработки текстов, морфологический анализ, представление текста в виде вектора, TF*IDF, меры сходства.

Лекция 2 Синтаксический анализ.

Лекция 3, часть 1 Методы снижения размерности пространства.
Лекция 3, часть 2 Методы кластеризации: k средних, DB SCAN.
Лекция 3, часть 3 Основные опеределения из области классификации, метод k ближайших соседей, линейная регрессия.

Лекция 4, часть 2 Методы классификации, основанные на деревьях.
Лекция 4, часть 3 Ансамблевые методы классификации.

Лекция 5, часть 1 Векторизация текстов с использованием Word2Vec и FastText.
Лекция 5, часть 2 Определение сходства слов при помощи расстояния Левенштейна.
Лекция 5, часть 3 Методы выделения неоднословных конструкций.

Лекция 6, программная часть Работа с полносвязными нейронными сетями.