Фреймворк для определения семантики коротких текстов.
Состоит из экстрактора и фич (папка extractors), модулей машинного обучения(папка ml) и диспетчера, содержащего систему контроля качества, а также вспомогательных модулей (папка helping tools). Папка data не является частью репозитория, она содержит обучающее множество и множество для тестирования(папки extractor_data - данные для экстрактора, training_data - для МО, testing_data - для диспетчера); у каждого разработчика своё содержимое в этой папке.
Вспомогательные программы:
-
BashViewer - программа под андроид для упрощения процедуры получения чистой разметки: BashViewer
-
GUI - программы с графическим интерфейсом (см readme в папке)
-
extractors/* - экстрактор и скрипт, содержащий различные фичи (смотри readme в папке)
-
helping tools/* - вспомогательные скрипты (смотри readme в папке)
-
ml/* - модули МО (смотри readme в папке)
-
old/extractors/ - папка, содержащая предыдущие (теперь неиспользуемые) версии экстракторов
-
presentations/ - презентации относящиеся к проекту (tex и pdf)
-
manager.py - диспетчер