- что было сделано:
- EDA и предобработка признаков,
- модели: линейная регрессия, Lasso и Ridge,
- подобраны гиперпараметры моделей на кроссвалидации,
- опробованы разные варианты обучающих датасетов (только вещественные признаки, вещественные+категориальные признаки),
- Feature Engineering (разные варианты скейлера, добавление полиномиальных признаков, логарифмирование таргета),
- написана функция для кастомной бизнес-метрики по заданному ТЗ,
- реализован сервис на FastAPI, скриншоты его работы тут
- с какими результатами и что дало наибольший буст:
- наилучших результатов удалось достичь, используя полиномиальные признаки, логарифмирование таргета и линейную регрессию - r2 на test 0.8535
- добавление категориальных признаков к вещественным также позволило улучшить скор модели
- что сделать не вышло и почему:
- не удалось сделать дополнительную визуализацию (рисование красивых графиков - не моя самая сильная сторона)