/senty

Primary LanguagePython

senty

Фреймворк для определения семантики коротких текстов.

Состоит из экстрактора и фич (папка extractors), модулей машинного обучения(папка ml) и диспетчера, содержащего систему контроля качества, а также вспомогательных модулей (папка helping tools). Папка data не является частью репозитория, она содержит обучающее множество и множество для тестирования(папки extractor_data - данные для экстрактора, training_data - для МО, testing_data - для диспетчера); у каждого разработчика своё содержимое в этой папке.

Вспомогательные программы:

  • BashViewer - программа под андроид для упрощения процедуры получения чистой разметки: BashViewer

  • GUI - программы с графическим интерфейсом (см readme в папке)

  • extractors/* - экстрактор и скрипт, содержащий различные фичи (смотри readme в папке)

  • helping tools/* - вспомогательные скрипты (смотри readme в папке)

  • ml/* - модули МО (смотри readme в папке)

  • old/extractors/ - папка, содержащая предыдущие (теперь неиспользуемые) версии экстракторов

  • presentations/ - презентации относящиеся к проекту (tex и pdf)

  • manager.py - диспетчер