Kaggle: House Prices - Advanced Regression Techniques (https://www.kaggle.com/c/house-prices-advanced-regression-techniques/overview)
Data ini berisi 79 variabel penjelas (fitur) untuk memprediksi harga jual setiap rumah (variabel "SalePrice").
Langkah-langkah yang saya lakukan adalah sebagai berikut:
- Import library dasar yang diperlukan
- Import dataset
- Exploratory Data Analysis (EDA)
- Feature Selection dengan melihat nilai korelasi dan menghapus fitur dengan missing value yang banyak
- Feature Engineering yaitu mengatasi missing value, mengatasi variabel kategorik, dan melakukan penskalaan data
- Target Engineering dengan menormalisasikan data
- Modelling dengan menggunakan Random Forest sekaligus evalusi model menggunakan Root Mean Square Error (RMSE)
Terdapat artikel yang saya buat: https://wandalistathea.medium.com/prediksi-harga-jual-rumah-menggunakan-random-forest-regression-python-58e11e0ba504