/3rd-ML100Days

Primary LanguageJupyter Notebook

3nd-ML100Days_Marathon

百日馬拉松


  • 0. 機器學習概論

  1. 資料介紹與評估資料

  2. 機器學習概論

  3. 機器學習-流程與步驟

  4. EDA/讀取資料與分析流程


  • 1. 資料清理數據前處理

  1. 如何新建一個 dataframe? 如何讀取其他資料? (非 csv 的資料)

  2. EDA: 欄位的資料類型介紹及處理

  3. 特徵類型

  4. EDA資料分佈

  5. EDA: Outlier 及處理

  6. 數值型特徵 - 去除離群值

  7. 常用的數值取代:中位數與分位數連續數值標準化

  8. 數值型特徵-補缺失值與標準化

  9. DataFrame operationData frame merge/常用的 DataFrame 操作

  10. 程式實作 EDA: correlation/相關係數簡介

  11. EDA from Correlation

  12. EDA: 不同數值範圍間的特徵如何檢視/繪圖與樣式Kernel Density Estimation (KDE)

  13. EDA: 把連續型變數離散化

  14. 程式實作 把連續型變數離散化

  15. EDA from Correlation

  16. Heatmap & Grid-plot

  17. 模型初體驗 Logistic Regression


  • 2. 資料科學特徵工程技術