Machine Learning from Scratch with Python

본 강의는 TEAMLABInflearn이 함께 구축한 데이터 사이언스 과정의 두 번째 강의인 밑바닥 부터 시작하는 머신러닝 입문 입니다. 밑바닥부터 시작하는 머신러닝 입문은 Part I과 Part II로 구성되어 있습니다.

본 강의는 TEAMLABInflearn이 함께 준비한 WADIZ 펀딩의 지원을 받아제작되었습니다. 아래 목록에 대한 강의를 개발할 예정입니다.

또한 기존 K-MOOC 과정은 아래 목록을 참고하시기 바랍니다.

Course overview

Course Info

  • 본 과정은 머신러닝에 대한 기초개념과 주요 알고리즘들에 대해 이해하고 구현하는 것을 목적으로 함
  • 본 과정을 통해 수강자는 데이터 과학에서 사용되는 다양한 용어에 대한 기본적인 이해를 할 수 있음
  • 본 과정의 기본적인 구성은 알고리즘에 대한 설명, Numpy를 사용한 구현, Scikit-Learn을 사용한 패키지 활용으로 이루어 져 있음
  • 수강자는 머신러닝에서 주로 사용되는 알고리즘을 구현하기 위해 고등학교 수준의 통계학과 선형대수학의 이해가 필요함
  • 수강자는 본 과정을 통해 Numpy, Pandas, Matplotlib, Scikit-Learn 등 데이터 분석을 위한 기본적인 파이썬 패키지를 이해하게됨

Course Contents

Chapter 1 - Introduction to Machine Learning

Chapter 2 - Warm Up Section: An understanding of data

Lecture

Supplements - Linear algebra

  • Lab: Simple Linear algebra concepts - [강의영상](), 강의자료
  • Lab: Simple Linear algebra codes - 강의영상, 강의자료
  • Assignment: Linear algebra with pythonic code - PDF, 강의자료

Chapter 3 - Numpy Section

Lecture

Supplements

Chapter 4 - Pandas Section #1

Lecture

Chapter 5 - Pandas Section #2

Lecture

Chapter 6 - Matplotlib Section & Miniproject

Lecture

Chapter 7 - Linear Regression

Lecture

  • Chapter overview - 강의자료, 강의코드, 코드다운로드
  • Linear regression overview - 강의영상
  • Cost functions - 강의영상
  • Normal equation - 강의영상
  • Lab Assignment: Normal equation - PDF, 강의자료
  • Gradient descent approach - 강의영상
  • Linear regression wtih gradient descent - 강의영상
  • Linear regression implementation wtih Numpy - 강의영상
  • Multivariate linear regression models - 강의영상
  • Performance measure for a regression model - 강의영상
  • Linear regression implementation wtih scikit-learn - 강의영상
  • Lab Assignment: Gradient descent - PDF, 강의자료

Chapter 8 - Linear Regression extended

Lecture

  • Chapter overview - 강의자료, 강의코드, 코드다운로드
  • Stochastic gradient descent - 강의영상
  • SGD implementation issues - 강의영상
  • Overfitting and regularization overview - 강의영상
  • Regularization - L1, L2 - 강의영상
  • sklearn Linear Model family - 강의영상
  • Polynomial regression - 강의영상
  • Sampling method - 강의영상
  • Kaggle project : Bike demand - 강의영상

Chapter 9 - Logistics Regression

Lecture

  • Chapter overview - 강의영상, 강의자료, 강의코드
  • Logistic regression overview - 강의영상
  • Sigmoid function - 강의영상
  • Cost function - 강의영상
  • Logistic regression implementation with numpy - 강의영상
  • Maximum Likelyhood Estimation - 강의영상
  • Logistic regression with scikit-learn - 강의영상
  • Confusion matrix - 강의영상
  • Performance metrics for classification - 강의영상
  • ROC curve & AUC - 강의영상

Chapter 10 - Logistics Regression extended

Lecture

  • Chapter overview - 강의자료, 강의코드
  • Multiclass Classification overview - 강의영상
  • Softmax function #1 - 강의영상
  • Softmax function #2 - 강의영상
  • Softmax regression with numpy - 강의영상
  • Performance metrics for classification - 강의영상
  • Multiclass classification with scikit-learn - 강의영상

Chapter 11 - Naive Bayesian Classifier

Lecture

  • Chapter overview - 강의영상, 강의자료, 강의코드
  • Probability overview - 강의영상
  • Bayes' theorem - 강의영상
  • Single variable bayes classifier - 강의영상
  • Navie bayesian Classifier - 강의영상
  • NB Classifier Implementation - 강의영상
  • Multinomial Naive Bayes - 강의영상
  • Gaussian Naive Bayes - 강의영상
  • NB classifier with sklearn - 강의영상
  • 20news group classifaication - 강의영상#1, #2

Supplements

  • Text hadnling Lab: News categorization - 강의영상#1, #2, 강의자료

Chapter 12 - Decision Tree

Lecture

  • Chapter overview - 강의영상, 강의자료, 강의코드
  • Decision tree overview - 강의영상
  • The concept of entropy - 강의영상
  • The algorithme of growing decision tree - 강의영상
  • ID3 & Information gain - 강의영상
  • CART & Gini Index - 강의영상
  • Tree pruning - 강의영상
  • Decision Tree with sklearn - 강의영상
  • Handling a continuous attribute - 강의영상
  • Decision Tree for Regression - 강의영상

Chapter 13 - Ensemble

Lecture

  • Chapter intro - 강의영상, 강의자료, 강의코드
  • Ensemble model overview - 강의영상
  • Voting classifier - 강의영상
  • Bagging - 강의영상
  • Random Forest - 강의영상
  • AdaBoost - 강의영상
  • Gradient boosting - 강의영상#1, 영상#2
  • XGBoost & LightGBM - 강의영상
  • Installation guide on Windows - 강의영상, 강의자료
  • Stacking - 강의영상

Chapter 14 - Performance tuning

Lecture

Chapter 14 - Support Vector Model

Lecture

Chapter 15 - Neural Network

Lecture

참고자료

Textbooks

  • Reading materials
  • Supplementary textbooks

Prerequisites - 수강전 이수 또는 수강중 들었으면 하는 교과들

키워드

머신러닝, 머신러닝 강좌, 머신러닝 입문, Machine Leaning 입문, Machione Learning 강좌, 머신러닝 강의, 머신러닝 MOOC, Linear Regression, 선형회귀, 앙상블, 딥러닝, 뉴럴넷, 파이썬, python, 파이썬 입문, 파이썬 강좌, Python 입문, 파이썬 강좌, 파이썬 강의, Python 강의, Python MOOC, 데이터마이닝, Data mining, 가천대 최성철, 최성철 교수, 프로그래밍 입문, 프로그래밍 강좌, 코딩, 코딩 입문, 데이터 과학, 데이터 사이언스, Data science