Day08: 常用的DataFrame操作merge/transform/subset/groupby,並繪製 baxplot & 計算Z轉換後的分數
Day09: 模擬一組負相關的資料,並計算出相關係數以及畫出scatter plot
Day11: 畫sns.distplot/sns.barplot(Bar & KDE (density plot))
Day12: 新增一個欄位 customized_age_grp,把 age 分為 (0, 10], (10, 20], (20, 30], (30, 50], (50, 100] 五組
Day13: 將年齡資料('DAYS_BIRTH' 除以365)離散化 & 繪製"離散化標籤"與目標值('TARGET')的長條圖(sns.barplot)
Day14: 使用subplot排版
Day15: 建立數值分布矩陣並繪製Heatmap & PairPlot(上半部為scatter,對角線為hist,下半部為density)
Day17: 理解什麼是"特徵工程"的區塊 & 那些欄位屬於"類別型欄位"/哪個欄位是"目標值"?
Day18: 觀察三種類型(int/float/object)的欄位分別進行(平均mean/最大值Max/相異值nunique)
Day23: 均值編碼實作 & 均值編碼與標籤編碼兩者比較
Day25: 時間型特徵 & 週期循環特徵
Day26: 經緯度
Day28: Feature_Selection -> 變更相關係數門檻值(Filter) & 使用 Lasso(L1)嵌入法(自訂門檻)(Embedded)