jason-li-831202/6st-DL-CVMarathon

機器學習百日馬拉松

Jupyter Notebook

6st-DL-CVMarathon

機器學習百日馬拉松

➤ 1.機器學習概論

D1〜D3 - 從概念上理解機器學習的目的與限制，並導覽機器學習流程

➤ 2.資料清理數據前處理

D4〜D18 - 探索式資料分析（Exploratory Data Analysis，簡稱 EDA），就是運用視覺化、基本的統計等工具，來「看」一下資料；以期進行複雜或嚴謹的分析之前，能夠對資料有更多的認識
D19〜D20 - 資料視覺化

➤ 3.資料科學特徵工程技術

D23 - 數值型特徵
D24〜D26、D32 - 分類型特徵
D27 - 時間型特徵
D28〜D30 - 特徵組合和選擇
D31 - 特徵評估

➤ 4.監督式機器學習基礎模型建立

D33〜D36 - 數據劃分和模型類別及評估
D37〜D40 - regression model 介紹
D41〜D42 - tree base model 介紹
D43〜D44 - 集成方法:Bagging (RF)
D45〜D46 - 集成方法:Boosting
D47 - 調整超參數
D49 - 集成方法:混合泛化Blending
D50 - 集成方法:堆疊泛化Stacking

➤ 5.非監督式機器學習基礎模型建立

D54 - 非監督式機器學習介紹
D55〜D58 - 聚類
D59〜D62 - 降維

➤ 6.深度學習

D63〜D65 - 深度學習介紹
D66〜D70 - keras介紹和範例
D71〜D76、D80、D84 - 超參數介紹和原理
D77〜D79、D81〜D83、D85〜D89 - 訓練技巧
D90〜D91 - 傳統CV辨識
D92〜D97 - CNN/Pool介紹和範例