Тетрадки:
- dataset, p.1 - тетрадка с созданием датафрейма с информацией об односложных словах
- dataset, p.2 - добавление новых параметров в созданный датасет
- plots - статистика, графики и анализ результатов
- is_ict - создание алгоритма, определяющего по слову и его параметрам наличие икта
- meter_recognition - применение алгоритма, определяющего стихотворный размер, сравнение результатов с надстройкой is_ict и без неё
Ссылки на датасеты:
syllab-tonic-lines.tsv - исходный датасет (строки силлабо-тонических стихов)
mono_df_all.csv - датасет с информацией об односложных словах
mono_df_all_new.csv - обновлённый датасет с информацией об односложных словах
df_alg.csv - сокращённый датасет с информацией об односложных словах (только столбцы, необходимые для работы алгоритма в is_ict.ipynb)
sum_data.csv - суммаризированная информация из df_alg.csv (для быстрой работы алгоритма в meter_recognition.ipynb)