- Thực hiện Ordinal Encoding dựa trên thư viện của sklearn trên cột dữ liệu ordinal và huấn luyện lại mô hình Linear Regression.
- Thực hiện One-Hot Encoding cho cả bộ dữ liệu giá và huấn luyện lại mô hình Lasso, Ridge với tham số phù hợp.
- Kiểm tra thử xem các trường dữ liệu khác còn nhiễu không, tiến hành lọc nhiễu và huấn luyện lại mô hình ElasticNet.
- Giải thích sự khác nhau và ý nghĩa trong công thức của Lasso, Ridge và ElasticNet.
- Áp dụng thử KNeighborsRegressor của sklearn cho dữ liệu giá nhà và so sánh performance với các mô hình Linear Regression, Lasso, Ridge, ElasticNet.
- Tiến hành phân tích mô tả cho dữ liệu bank_data.
- Tìm hiểu ý nghĩa và thay đổi một số metrics như weights, algorithm, leafsize,… và hệ số n_neighbors phù hợp của mô hình kNN, so sánh performance.