/word_cloud_generation

Генератор произвольного облака слов на основе веб-страницы с текстом формата *.txt или страницы Википедии. Используются библиотеки request, re, nltk, natasha, matplotlib, wikipedia, wordcloud.

Primary LanguageJupyter NotebookOtherNOASSERTION

word_cloud_generation

Генератор облака слов на основе текста в формате *.txt или страницы Википедии.

Используемые библиотеки

Текст очищается от знаков препинания и специальных символов с помощью регулярных выражений (библиотека re), очищается от стоп-слов и лемматизируется с помощью библиотеки NLTK.

Цели проекта

  1. Изучение библиотек request, re, nltk, natasha, matplotlib, wikipedia, wordcloud.
  2. Создание инструмента, который может использоваться для обучающих, исследовательских и личных целей.

Требования

Для использования программы требуется Jupyter Notebook (https://jupyter.org/try).