/ML_HT

ML hometask

Primary LanguageJupyter NotebookMIT LicenseMIT

ML hometask1

  • что было сделано:
    • EDA и предобработка признаков,
    • модели: линейная регрессия, Lasso и Ridge,
    • подобраны гиперпараметры моделей на кроссвалидации,
    • опробованы разные варианты обучающих датасетов (только вещественные признаки, вещественные+категориальные признаки),
    • Feature Engineering (разные варианты скейлера, добавление полиномиальных признаков, логарифмирование таргета),
    • написана функция для кастомной бизнес-метрики по заданному ТЗ,
    • реализован сервис на FastAPI, скриншоты его работы тут
  • с какими результатами и что дало наибольший буст:
    • наилучших результатов удалось достичь, используя полиномиальные признаки, логарифмирование таргета и линейную регрессию - r2 на test 0.8535
    • добавление категориальных признаков к вещественным также позволило улучшить скор модели
  • что сделать не вышло и почему:
    • не удалось сделать дополнительную визуализацию (рисование красивых графиков - не моя самая сильная сторона)