/kopylova_vkr

Primary LanguageJupyter Notebook

kopylova_vkr

Тетрадки:

  • dataset, p.1 - тетрадка с созданием датафрейма с информацией об односложных словах
  • dataset, p.2 - добавление новых параметров в созданный датасет
  • plots - статистика, графики и анализ результатов
  • is_ict - создание алгоритма, определяющего по слову и его параметрам наличие икта
  • meter_recognition - применение алгоритма, определяющего стихотворный размер, сравнение результатов с надстройкой is_ict и без неё

Ссылки на датасеты:

syllab-tonic-lines.tsv - исходный датасет (строки силлабо-тонических стихов)

mono_df_all.csv - датасет с информацией об односложных словах

mono_df_all_new.csv - обновлённый датасет с информацией об односложных словах

df_alg.csv - сокращённый датасет с информацией об односложных словах (только столбцы, необходимые для работы алгоритма в is_ict.ipynb)

sum_data.csv - суммаризированная информация из df_alg.csv (для быстрой работы алгоритма в meter_recognition.ipynb)