По мотивам статьи: Unsupervised Transfer Learning for Spoken Language Understanding in Intelligent Agents
Процесс | Срок | Ответсвенный |
---|---|---|
Подготовка large корпуса (разговоры, комментарии и т.п.) русского языка. Парсинг + поиск в сети. | 03.04.2019 | Афанасьев |
Препроцессинг текста (Бученкова). Изучить различные варианты, также посмотреть можно сюда, Результат процесса - копрус для подачи в Elmo. | 05.04.2019 | Бученкова |
Обучение на готовом корпусе ElmoL. Разобраться с конфигами. | 08.04.2019 | Макаревич |
Обучение на готовом корпусе FastText. | 08.04.2019 | Бученкова |
Протестить и сравнить эмбеддинги ElmoL и FastText на классификаторе. | 10.04.2019 | Макаревич |
Подготовка и сборка готового модуля tf.Hub, пример тута. | 12.04.2019 | Афанасьев |
(optional) В готовый код встатить ULMFiT для файнтюнинга на конечном датасете. | 18.04.2019 |