/6st-DL-CVMarathon

機器學習百日馬拉松

Primary LanguageJupyter Notebook

6st-DL-CVMarathon

機器學習百日馬拉松

➤ 1.機器學習概論

  • D1〜D3 - 從概念上理解機器學習的目的與限制,並導覽機器學習流程

➤ 2.資料清理數據前處理

  • D4〜D18 - 探索式資料分析(Exploratory Data Analysis,簡稱 EDA),就是運用視覺化、基本的統計等工具,來「看」一下資料;以期進行複雜或嚴謹的分析之前,能夠對資料有更多的認識
  • D19〜D20 - 資料視覺化

➤ 3.資料科學特徵工程技術

  • D23 - 數值型特徵
  • D24〜D26、D32 - 分類型特徵
  • D27 - 時間型特徵
  • D28〜D30 - 特徵組合和選擇
  • D31 - 特徵評估

➤ 4.監督式機器學習基礎模型建立

  • D33〜D36 - 數據劃分和模型類別及評估
  • D37〜D40 - regression model 介紹
  • D41〜D42 - tree base model 介紹
  • D43〜D44 - 集成方法:Bagging (RF)
  • D45〜D46 - 集成方法:Boosting
  • D47 - 調整超參數
  • D49 - 集成方法:混合泛化Blending
  • D50 - 集成方法:堆疊泛化Stacking

➤ 5.非監督式機器學習基礎模型建立

  • D54 - 非監督式機器學習介紹
  • D55〜D58 - 聚類
  • D59〜D62 - 降維

➤ 6.深度學習

  • D63〜D65 - 深度學習介紹
  • D66〜D70 - keras介紹和範例
  • D71〜D76、D80、D84 - 超參數介紹和原理
  • D77〜D79、D81〜D83、D85〜D89 - 訓練技巧
  • D90〜D91 - 傳統CV辨識
  • D92〜D97 - CNN/Pool介紹和範例