/NLP_DPO_2020

Primary LanguageJupyter Notebook

NLP-блок курса "Практический анализ данных" (ФКН НИУ ВШЭ), 2020

Занятие 1

  • Вводная лекция, препроцессинг текста Open In Colab
  • Препроцессинг текста + анализ тональности Open In Colab
  • Регулярные выражения Open In Colab

Занятие 2

  • Word embeddings Open In Colab
  • Тематическое моделирование Open In Colab

ДЗ 1 Классификация новостей Open In Colab

Соревнование: https://www.kaggle.com/c/lenta-news-classification

Занятие 3

  • Синтаксический парсинг Open In Colab
  • Классификация с помощью CNN Open In Colab
  • Языковые модели и генерация текста Open In Colab

Занятие 4

  • Transformer-based архитектуры
  • seq2seq задачи (машинный перевод, нормализация)
  • Извлечение именованных сущностей
  • POS-теггинг