Code review
Closed this issue · 0 comments
stasysp commented
прверить [11], на сколько применимо такое деление к этим данным (нет ли категориальных признаков выраженных числами)
да, когда слишком хорошо, настораживает =)
Странное решение выбрасывать признаки с большим feature importance, ведь у нас в тех трех методах ошибка была маленькая и на трэйне и не тесте. Можно посмотреть повнимательнее препроцессинг, нет ли утечки данных в тестовую выборку (например, на этапе заполнения пропущенных значений) (хотя, на мой взгляд там все нормально, вполне стандартный подход)