/2021-13th-ironman

全民瘋AI系列 [經典機器學習]

Primary LanguageCSS

📢 2023 更新公告

大家好!我有個好消息要告訴大家。今年我參加了2023年第15屆iT幫鐵人賽的AI&Data組,我的主題是「揭開黑箱模型:探索可解釋人工智慧」,這是全民瘋AI系列的進階篇。在新的系列本系列將從 XAI 的基礎知識出發,深入探討可解釋人工智慧在機器學習和深度學習中的應用、案例和挑戰,以及未來發展方向。有興趣朋友歡迎點選下面連結前來iT幫支持與訂閱。

傳送門 ⬇


全民瘋AI系列2.0

第13屆iT邦幫忙鐵人賽

鐵人賽列表

文章 程式
[Day 1] 全民瘋AI系列2.0-機器學習實戰手冊 -
[Day 2] 快來探索AI的世界 -
[Day 3] 你真了解資料嗎?試試看視覺化分析吧! Code
[Day 4] 咱們一起做資料清理和前處理 Code
[Day 5] 機器學習大補帖 -
[Day 6] 非監督式學習 K-means 分群 Code
[Day 7] 非監督式學習-降維 Code
[Day 8] 線性迴歸 (Linear Regression) Code
[Day 9] 邏輯迴歸 (Logistic Regression) Code
[Day 10] 近朱者赤,近墨者黑 - KNN Code 1Code 2
[Day 11] 核模型 - 支持向量機 (SVM) Code 1Code 2
[Day 12] 決策樹 (Decision tree) Code 1Code 2
[Day 13] 整體學習 (Ensemble Learning) -
[Day 14] 多棵決策樹更厲害:隨機森林 (Random forest) Code 1Code 2
[Day 15] 機器學習常勝軍 - XGBoost Code 1Code 2
[Day 16] 每個模型我全都要 - 堆疊法 (Stacking) Code
[Day 17] 輕量化的梯度提升機 - LightGBM Code
[Day 18] 機器學習 boosting 神器 - CatBoost Code
[Day 19] 自動化機器學習 - AutoML -
[Day 20] 機器學習金手指 - Auto-sklearn Code
[Day 21] 調整模型超參數利器 - Optuna Code
[Day 22] Python 視覺化解釋數據 - Plotly Express Code
[Day 23] 資料分布與離群值處理 Code
[Day 24] 機器學習 - 不能忽視的過擬合與欠擬合 -
[Day 25] 交叉驗證 Cross-Validation 簡介 -
[Day 26] 交叉驗證 K-Fold Cross-Validation -
[Day 27] 機器學習常犯錯的十件事 -
[Day 28] 儲存訓練好的模型 Code
[Day 29] 使用 Python Flask 架設 API 吧! Code
[Day 30] 使用 Heroku 部署機器學習 API Code

前言

哈囉大家好我是10程式中的10!我是上一屆鐵人賽影片教學組全民瘋AI系列的作者,當時講解了人工智慧的基礎以及常見的機器學習演算法與手把手教學。由於大家反應很熱烈,讓我看到了大家對於AI的學習熱忱。也因為上一屆獲得了影片教學組優選,收到了許多書商的出版邀請,由於我沒有時間與動力將這些大量知識寫成文章因此都婉拒了。因此我想藉由這一次鐵人賽將上一屆的影片內容整理成電子書版本,提供大家影片教學與文字版的筆記內容(唷呼書商快看過來~)當然內容會以之前影片教學為基底,並加入一些新的元素讓文章內容變得更紮實。在全新的全民瘋AI系列2.0中我會介紹實用的機器學習演算法並含有程式手把手實作,以及近年來熱門的機器學習套件與模型調參技巧。除此之外我還會提到大家最感興趣的 AI 模型落地與整合。希望在這次的鐵人賽能夠將AI的資源整理得更詳細並分享給各位。

此系列教學適合誰?

如果您是之前的舊讀者,歡迎回來為自己充電~新的系列文章保證讓你收穫滿滿!若您是新來的讀者歡迎加入人工智慧的世界,此系列文章正適合初學者閱讀。另外建議可以搭配我上一屆鐵人賽的影片教學進行學習。

系列文章內容規劃

在本次鐵人賽預計新增了許多新內容,特別是近年來比較新的演算法套件,以及在模型訓練中必須注意的大小事。本系列要在短短30天內講完所有 AI 領域相關應用是不太可能的事情,因此我的規劃是從認識人工智慧開始切入主題。先讓大家知道何謂人工智慧以及相關應用有哪些。接著帶各位了解成為資料科學家的第一步,就是資料分析與視覺化,再來會有一系列經典的機器學習演算法介紹。最後也是大家可能會有興趣的整合部分,會以實際的帶大家手把手部署我們的AI模型以及前後端串接的概念。

前置作業資源

本系列教學將有大量的程式實作,並採用 Google Colab 做為程式雲端運行的編輯執行環境。各位可以直接利用 Colab 開啟本系列文章的範例程式。在使用此平台之前每個人都必須要有自己的 Google 帳號,才能順利的開啟並執行程式碼。Colab 可讓你輕鬆地在瀏覽器上撰寫並執行 Python 程式語言,它可以說是機器學習新手的入門工具。此外 Colab 具備了以下幾個優點:

  • 不必進行任何設定與安裝
  • 免費額度使用 GPU、TPU 資源
  • 輕鬆共用與分享檔案

因此讀者必須先熟悉 Colab 的操作模式,想了解該如何操作的朋友們可以先來看這部影片教學。

回報錯誤與建議

本系列文章若有問題或是內容建議都可以來 GitHub 中的 issue 提出。歡迎大家一同貢獻為這系列文章有更好的閱讀品質。

關於作者

曾任職於台灣人工智慧學校擔任AI工程師,具有豐富教學經驗,熱衷網頁前後端整合發與AI演算法開發。希望藉由鐵人賽,將所學貢獻出來提升臺灣在AI領域的資源。

@andy6804tw

歡迎大家訂閱我的 YouTube 頻道。

本系列教學內容都可以從我的 GitHub 取得!