3nd-ML100Days_Marathon / 第 3 屆 / 機器學習 百日馬拉松 0. 機器學習概論 資料介紹與評估資料 機器學習概論 機器學習-流程與步驟 EDA/讀取資料與分析流程 1. 資料清理數據前處理 如何新建一個 dataframe? 如何讀取其他資料? (非 csv 的資料) EDA: 欄位的資料類型介紹及處理 特徵類型 EDA資料分佈 EDA: Outlier 及處理 數值型特徵 - 去除離群值 常用的數值取代:中位數與分位數連續數值標準化 數值型特徵-補缺失值與標準化 DataFrame operationData frame merge/常用的 DataFrame 操作 程式實作 EDA: correlation/相關係數簡介 EDA from Correlation EDA: 不同數值範圍間的特徵如何檢視/繪圖與樣式Kernel Density Estimation (KDE) EDA: 把連續型變數離散化 程式實作 把連續型變數離散化 EDA from Correlation Heatmap & Grid-plot 模型初體驗 Logistic Regression 2. 資料科學特徵工程技術