Цифровой прорыв 2021(Финал) кейс add tech

Задача

Постановку задачи можно посмотреть в файле Problem_statement.pdf в корне репозитория

Реализованная функциональность

  1. Генерация фичей на основе данных
  2. Классификация пользователей по заранее определнным организаторамии сегментам
  3. Кластеризация пользовательских сессий

Особенность проекта

  1. Предложение воспринимать кластеризацию сессий, как кластеризацию коротких текстов с дополнительными тэгами.
  2. Несколько оригинальных фичей на основе дополнительной информации.

Cтек технологий

  1. lightgbm
  2. pyLDAvis

Установка

  1. Установить requirements: pip install -r requirements.txt
  2. Классификация:
    1. Обучение
      1. Файл classification_train.ipynb
      2. Прописать актуальный путь к корню репы в 1 ячейке
      3. Запустить все ячейки
    2. Тест
      1. Файл classification_test.ipynb
      2. Прописать актуальный путь к корню репы в 1 ячейке
      3. Запустить все ячейки
  3. Для запуска Кластеризации Вам надо:
    1. Запустить все ячейки из clasterisation.ipynb

Финальный результат

Финальный результат лежит в output/final_results.zip

Разработчики

Кузнецов Сергей Юрьевич fullstack https://t.me/test@just_nickname

Мошков Николай Евгеньевич fullstack https://t.me/test@Affernus

Кузнецова Марина Юрьевна fullstack https://t.me/test@Mila_601