Цифровой прорыв 2021(Финал) кейс add tech
Задача
Постановку задачи можно посмотреть в файле Problem_statement.pdf в корне репозитория
Реализованная функциональность
- Генерация фичей на основе данных
- Классификация пользователей по заранее определнным организаторамии сегментам
- Кластеризация пользовательских сессий
Особенность проекта
- Предложение воспринимать кластеризацию сессий, как кластеризацию коротких текстов с дополнительными тэгами.
- Несколько оригинальных фичей на основе дополнительной информации.
Cтек технологий
- lightgbm
- pyLDAvis
Установка
- Установить requirements: pip install -r requirements.txt
- Классификация:
- Обучение
- Файл classification_train.ipynb
- Прописать актуальный путь к корню репы в 1 ячейке
- Запустить все ячейки
- Тест
- Файл classification_test.ipynb
- Прописать актуальный путь к корню репы в 1 ячейке
- Запустить все ячейки
- Обучение
- Для запуска Кластеризации Вам надо:
- Запустить все ячейки из clasterisation.ipynb
Финальный результат
Финальный результат лежит в output/final_results.zip
Разработчики
Кузнецов Сергей Юрьевич fullstack https://t.me/test@just_nickname
Мошков Николай Евгеньевич fullstack https://t.me/test@Affernus
Кузнецова Марина Юрьевна fullstack https://t.me/test@Mila_601