Machine Learning Study 혼자 해보기
기여자 (Contributors)
HongJaeKwon, Seungwoo Han, Tae Heon Kim, Steve Kwon
더 많은 분들이 도움을 받으실 수 있도록, 좋은 공유 자료에 대하여 Pull Request를 날려주세요!
지식공유 (Knowledge Sharings)
블로그, 유튜브를 통해 지식공유를 실천하고 있습니다.
취지
This repository is intended for personal study in machine-learning
머신러닝 분야를 스스로 스터디 하는 많은 분들께 도움이 되고자 작성하였습니다.
온라인 상에서 좋은 분들이 공유해 주신 Lecture와 Blog를 참고하여 스터디 하실 수 있습니다.
직접 들은 강의는 코멘트하였으나, 지극히 개인적인 의견이 반영 되었습니다.
동영상 강의 묶음, 재생목록 (Video Lectures)
Video 강좌는 제가 개인적으로 생각하는 순차적 학습 단계 입니다. 물론, 난이도와도 연관이 있습니다.
파이썬 (Python), 데이터분석 (Pandas, Numpy), 시각화 (Matplotlib, Seaborn, Bokeh, Folium)
- 생애 첫 코딩 - 파이썬 (김정욱)
- 코딩 학원을 운영하고 있는 김정욱 대표의 파이썬 입문 강좌 (3시간). 라이트 과정은 무료로 제공하고 있습니다.
- 파이썬 강좌 코딩 기초 강의 Python | 김왼손의 왼손코딩
- 딥러닝을 위한 파이썬 - 신경식님
- NumPy(넘파이) 기본 - T아카데미
- Pandas 기본기 다지기 - T아카데미
- Pandas로 하는 시계열 데이터분석 - T아카데미
- 입문자를 위한 파이썬 기초 따라잡기 - 재즐보프
- 파이썬 데이터 시각화 튜토리얼 - 재즐보프
수학 (Mathmatics) & 통계 (Statistics)
- 선형대수 기초 - 3Blue1Brown
- Mathematical Monk Youtube(영문)
- 딥러닝에 관련된 수학을 굉장히 쉽게 풀어놓은 유튜브.
- 딥러닝을 위한 선형대수학 - 올바른 수학교육 연구소
- 딥러닝 수학 강의 - 모두의연구소 Chanwoo Timothy Lee 님
- 직접 손글씨로 딥러닝 수학의 원리를 이해하는데 도움이 되는 강의
머신러닝 (Machine Learning) & 딥러닝 (Deep Learning)
-
Machine Learning by coursera - Andrew Ng
- 머신러닝을 처음 접하는 사람들을 위한 입문용 강좌. 무려 거장이신 Andrew Ng 교수님이 쉽게 설명해 주는 강의를 들을 수 있음.
-
밑바닥부터 시작하는 머신러닝 - 최성철 교수님(TEAMLAB)
- 머신러닝 스터디에 본격적으로 들어가기에 앞서 "데이터 과학을 위한 파이썬 입문" 추천. 다만 강의는 인프런에서 유료 (3만 3천원), 유튜브에서도 청취가능
-
모두를 위한 딥러닝 시즌 1 (Tensorflow) - 김성훈 교수님
- 입문용으로 최고의 강의임. tensorflow와 익숙하지 않아도 예제를 보면서 차근 차근 따라할 수 있음.
-
고등학교 수학만 알면 따라할 수 있는 인공지능, 머신러닝, 딥러닝 - 바람님
- 바람님께서 유튜브 채널에 공개한 딥러닝 오픈 강의. 입문자도 이해하기 쉽게 설명.
-
- 입문용으로 딥러닝에 대한 전반적인 이해를 위한 강의. 강의별 코드도 제공
-
- 영어로 진행되는 강좌. 영어가 익숙하다면 제일 먼저 이 강의를 듣고 개념을 정리하는 것을 추천.
-
- 입문자를 위하여 이해하기 쉽게 설명해주는 강의이며, 캐글을 경험하지 못한 분들은 입문용 강의로 추천.
-
Deep Learning by GOOGLE - Udacity
- 평균 1분 내외의 굉장히 짤막한 강의로 이루어져 있음. 어느 정도 중급 단계에서 실전 코딩을 해보기 위하여 듣는 것을 추천 (Assignment를 완료해 보는 것을 추천)
-
DEEP LEARNING, Spring 2020 - NYU CENTER FOR DATA SCIENCE
- 딥러닝의 거장 얀 르쿤 교수님과 Alfredo Canziani 의 딥러닝 강의. 슬랑이드와 렉쳐를 제공하며, 한국어 자막은 진행중입니다.
-
- 딥러닝에 대한 강좌라기 보다는 보다 재밌게 에피소드 별/ 카테고리 별로 짧고 쉽게 설명해 주시는 강의. 지루하지 않고 재밌게 들을 수 있으며, 알기 쉽게 설명해 주는 것이 포인트 (개념 정리용).
-
- 깔끔한 설명과 수학에 대한 친절한 설명까지 곁들여진 강의. 강의자의 전달력이 좋고, 코드 설명과 더불어 논문에 대한 내용도 다룬다.
주제별 (By Subjects)
- 수학 (Mathmatics)
- 통계 (Statistics)
- 머신러닝 (Machine Learning)
- 딥러닝 (Deep Learning)
- 최적화 & AutoML (Optimization-AutoML)
- 메타러닝 (Meta Learning)
- 시각화 (Visualization)
- 캐글 & 데이콘
- 블로그 (Blogs)
- 깃헙 저장소 (GitHub)
- 웹사이트 (Web Sites)
- 위키독스 (Wiki Docs)
- 유튜브 채널 (YouTube Channel)
- 논문 읽기 (YouTube)
- 데이터 사이언티스트 스토리 (Data Scientist Story)
- 페이스북 그룹 (Facebook Groups)
- 오픈데이터
- 텐서플로우 자격증
- 기타
수학 (Mathmatics)
-
기초
-
미분
-
유사도
-
선형대수
-
기타
- 그래핑 계산기 - Desmos
- 그래픽 계산기로 수학 공식을 그래프로 웹상에서 그려서 시각화해 줍니다.
- 그래핑 계산기 - Desmos
통계 (Statistics)
- 통계 종합
- 경영통계분석 - 이상철 교수님
- 통계학 입문자에게 듣기 굉장히 편하며, 입문자들도 알아듣기 쉽게 설명해 주시는 강의 입니다.
- 제대로 시작하는 기초 통계학 - 노경섭님
- 통계 공식과 개념들 한번에 총정리 해드립니다. (이산확률분포, 이항분포, 연속확률분포, 확률밀도함수, 표준정규분포, 표준화공식, 임의추출, 표본평균, 통계적추정, 모평균의추정) - 알고리즘성남학원
- 경영통계분석 - 이상철 교수님
- p-value
- 가설
- 분포
- 추정, 신뢰구간
- 베이즈 이론
- 푸리에 변환
머신러닝 (Machine Learning)
-
경사하강법 (Gradient Descent)
-
오차 역전파 (Back Propagation)
-
손실 함수 (Loss Functions)
-
선형회귀 (Linear Regression)
- 최소제곱법 증명 - 테디노트
- Least Squares Estimators 증명 - jbstatistics
- 최소자승법 - Least Squares Criterion Part 1 - patrickJMT
- 최소자승법 - Least Squares Criterion Part 2 - patrickJMT
- 머신러닝의 기초 - 선형 회귀 한 번에 제대로 이해하기 (30분만 투자해봐요!) - 동빈나
- 회귀분석 증명 - 최소자승법(Least Square Method)으로 모수 추정하기 - Data Scientist이지영님
- Linear Regression(선형회귀) 이해하기 - 허민석님
- 선형과 비선형의 차이 - 허민석님
- 머신러닝/딥러닝 수학 입문 5강 - 회귀분석 (Regression) | T아카데미
-
Norm (L1 & L2)
-
Lasso, Ridge, ElasticNet
-
Support Vector Machine (SVM)
-
KNN (K-Nearest Neighbors)
-
로지스틱 회귀(Logistic Regression)
-
의사결정나무(Decision Tree)
-
차원축소
-
군집 (Clustering)
딥러닝 (Deep Learning)
-
개요
-
Convolution Neural Networks (CNN)
-
Recurrent Neural Networks (RNN)
-
자연어 처리 (Natural Language Processing)
- 딥러닝을 이용한 자연어 처리 - 조경현 교수님
- Stanford - Natural Language Processing with Deep Learning
- 트랜스포머(어텐션 이즈 올 유 니드) - 허민석님
- Transformer: Attention Is All You Need (꼼꼼한 딥러닝 논문 리뷰와 코드 실습) - 동빈나님
- (CS231n 한글설명) Attention - 송교석님
- 시퀀스 투 시퀀스 + 어텐션 모델 - 허민석님
- Seq2Seq: Sequence to Sequence Learning with Neural Networks - 동빈나님
- 자연어 언어모델 "BERT"
-
음성인식 (Speech Recognition)
-
객체탐지 (Object Detection)
-
강화학습 (Reinforcement Learning)
-
생성적 적대 신경망 (Generative Adversarial Network)
- 1시간만에 GAN 완전 정복하기 - 네이버 D2
- GAN: Generative Adversarial Networks (꼼꼼한 딥러닝 논문 리뷰와 코드 실습) - 동빈나님
- Basic of GAN - 딥러닝 홀로서기 by Idea Factory KAIST
- DC GAN - 딥러닝 홀로서기 by Idea Factory KAIST
- DC GAN 논문 이해하기 - YBIGTA
- Finding connections among images using CycleGAN - naver d2
- 머신러닝/딥러닝 강의 - 016 CycleGAN 한방에 끝내기 - hanyoseob님
-
기타
- Improving Deep Neural Networks: Hyperparameter Tuning
- Andrew Ng 교수님이 직접 진행하는 DNN 개선을 위한 아이디어. 딥러닝 모델의 세부 내용을 더욱 자세히 이해하고 싶다면 꼭 들어보는 것을 추천.
- Why Does Batch Norm Work? (Batch Norm이 좋은 이유) - Andrew Ng교수님
- Adam Optimization Algorithm - Andrew Ng교수님
- Improving Deep Neural Networks: Hyperparameter Tuning
최적화 & AutoML (Optimization & AutoML)
- 유전 알고리즘 기반
- 베이지안 기반
- 하이퍼밴드 기반
- Neural Architecture Search
메타러닝 (Meta Learning)
시각화 (Visualization)
- Bokeh
기타 (Others)
- Azure 머신러닝
- 데이터베이스
- 페이스북 Prophet
캐글 & 데이콘
캐글이 처음이라면?
Hello Kaggle!
- Hello Kaggle! - stevekwon211 님
- 캐글에 대한 소개, 컨트리부터 되기, 대회 진행하는 법, 데이터셋, API 등이 설명되어 있는 문서
강의 & 강연
정형데이터
- 정형데이터 분석 노하우 - T아카데미
- 캐글, 데이콘 대회 (정형 데이터) 분석 노하우, 접근 방법에 대한 강의
강연
노트북
캐글 & 데이콘 대회 분류
입문 (For Beginners)
- Titanic: Machine Learning from Disaster
- 타이타닉 생존자 예측 대회. 사망/생존자 분류 대회
- Bike Sharing Demand
- 자전거 수요 예측 대회. 수요를 예측하는 회귀예측(regression) 대회
- Home Credit Default Risk
- 신용 불량에 대한 리스크 예측 대회 (ROC-AUC)
- House Prices: Advanced Regression Technique
- 집값 예측 대회 (회귀 예측)
비전 (Vision)
- Digit Recognizer
- Facial Keypoints Detection
- Dogs vs. Cats
- Right Whale Recognition
- Intel & MobileODT Cervical Cancer Screening
시계열 (Time Series)
- Web Traffic Time Series Forecasting
- Recruit Restaurant Visitor Forecasting
- Corporación Favorita Grocery Sales Forecasting
- Rossmann Store Sales
음성
블로그 (Blogs)
-
- 데이터분석, 머신러닝, 딥러닝 블로그
-
- 통계 관련 지식이 잘 정리되어 있는 블로그
-
- 데이터 분석, 머신러닝, 딥러닝 학습자라면 꼭 한번 씩은 가본 웹사이트. 노트북 정리가 잘 되어 있다. 운영자님께서 수학 강의도 하신다.
-
- 머신러닝, 딥러닝에 꼭 필요한 수학을 정리한 블로그
-
- 설명이 굳이 필요하지 않음. 텐서플로우를 다룬다면 모를리 없는 박해선님의 블로그. 좋은 책 번역을 많이 해주신다.
-
- 김성훈 교수님의 "모두를 위한 딥러닝 시즌 1" 강좌별 정리가 되어 있는 블로그
-
- 시각화에 대한 내용이 굉장히 정리가 잘 되어있는 블로그
-
- 연구 내용 중심의 데이터 사이언스 관련 블로그. 전문적인 내용이 많이 게재되어 있는 곳.
-
Google - Tensorflow Get Started (영문)
- Google의 공식 document 사이트 이며, Tensorflow 의 기본 구현 방법 튜토리얼
-
- 자연어 처리 분야 뿐만 아니라, 다른 딥러닝 관련 글도 퀄리티가 높다. 다만, 이해에 조금 어려운 부분도 있다.
-
- 수준 높은 논문을 정리한 글들이 많다. 논문 스터디에 대하여 요약된 글도 좋다.
-
매주 한편씩 글을 작성하는 자연어처리 블로그 - 위클리 NLP
- 매주 한 편씩 자연어처리 관련 블로그 글을 게재하며, 퀄리터 또한 우수하다.
-
- 한국어 임베딩 도서 튜토리얼 페이지. 한국어 자연어처리에 관심있는 분들은 한 번쯤 보시길.
-
- 추천 시스템 알고리즘 트렌드에 대하여 자세히 정리된 블로그
깃헙 저장소 (GitHub)
튜토리얼(Tutorial)
- 스탠포드 강의 한글 번역 repo - AIKorea.org
- 스탠포드 강의 요약본을 한글로 번역한 github repo
- pytorch-tutorial
- 10,000개 이상의 스타를 받은 PyTorch 튜토리얼 깃헙
- TensorFlow Example Source Code
- 텐서플로우 공식 깃헙(한글)
- 텐서플로우 공식 운영중인 깃헙이며, 튜토리얼과 가이드가 있습니다.
- 최성준님의 깃헙
- tensorflow를 활용한 많은 튜토리얼이 있음
- Tensorflow2.0 Tutorial - 허민석님
- 허민석님이 진행하는 유튜브 TensorFlow 2.0 강의와 실습자료가 있는 깃헙
강의(Lecture)
- 김성훈 교수님 - Deep Learning Zero To All
- 김성훈 교수님 유튜브 강의 (밑바닥부터 시작하는 딥러닝) 깃헙
- deepLearningOpenLecture - 바람님
- 유튜브 채널 바람님의 딥러닝 강의 실습 파일 깃헙
자연어처리(Natural Language Processing
- 한국어 임베딩 깃험
- 한국어 임베딩 도서에 관한 자료를 받아볼 수 있는 깃헙. 데이터 셋을 다운로드 받을 수 있습니다.
- 텐서플로2와 머신러닝으로 시작하는 자연어처리
- 최근 발간된 텐서플로2와 머신러닝으로 시작하는 자연어 처리 서적에 대한 샘플 코드가 수록되어 있는 깃헙.
- 자연어 처리 실무 깃헙 - 김웅곤님
- BERT, Transformer등 실무 코딩을 다룹니다. (colab 파일 제공)
- 국민은행 - KB-ALBERT-KO
- 국민은행에서 공개한 한글 ALBERT 모델
- 카카오 Khaiii 형태소 분석기
- 카카오에서 개발한 형태소 분석기 (Khaiii) 공식 깃헙
- 한글 자연어처리 기법 모음
- 직접 실행해 볼 수 있는 Colab 파일입니다. 각 종 한글 데이터 전처리 기법들을 모아 놓았습니다.
- Text Analysis - 고려대 DSBA 강필성 교수님
- 강의 슬라이드와 교안까지 깔끔하게 정리되어 있는 깃헙. 쉽고 템포를 천천히 강의해 주시기 때문에 듣기 편하고 이해가 비교적 쉽습니다.
GAN
- Keras GAN
- Keras를 활용한 GAN구현
- Keras-DCGAN
- DCGAN에 대한 Tutorial
- Keras-WGAN
- 미술관에 GAN 딥러닝
- GAN에 관련된 번역 서적 실습용 GitHub repo 입니다. 다양한 예제들이 보기 쉽게 제공됩니다.
- Gan ZOO
- GAN에 관한 사실상 거의 모든 논문이 정리된 깃헙
논문
- terryum - awesome-deep-learning-papers
- 딥러닝 관련 논문을 매우 잘 정리해 놓은 깃헙
서적 예제
- 파이썬 코딩의 기술 (Effective Python) - 길벗출판사
- 파이썬을 배우기 위한 서적 연습문제 및 예제 소스코드 제공
- Pandas, Numpy, Visualization - PythonDataScienceHandbook 튜토리얼
- PythonDataScienceHandbook 튜토리얼이 잘 정리된 colab. Pandas, Numpy, Visualization관련된 실습을 진행할 수 있습니다.
- 모두의 딥러닝 개정2판 - 길벗출판사
- 모두의 딥러닝 연습문제 및 예제 소스코드 제공
- 머신러닝을 다루는 기술 with 파이썬, 사이킷런 (2020)
- 서적의 연습문제 및 예제 소스코드 제공
- 핸즈온 머신러닝
- 핸즈온 머신러닝 서적의 예제 및 소스코드 제공
- 파이썬 머신러닝 완벽가이드
- 권철민님의 파이썬 머신러닝 완벽가이드 깃헙. 인프런에서 강의와 서적을 함께 보면 좋은 깃헙.
웹사이트 (Web Sites)
- 머신러닝 용어집
- 머신러닝 용어들이 정리되어 있는 구글 developer 사이트.
- 10 minutes to pandas
- 10분안에 빠르게 끝내는 판다스 훓어보기 (주요 api 위주로 진행하는 튜토리얼)
- 20 minutes to matplotlib
- 20분안에 빠르게 훓어보는 matplotlib (주요 api 위주로 진행하는 튜토리얼)
- Paper With Code
- 논문과 관련된 깃허브 저장소를 동시에 제공합니다.
- Codetorial
- numpy, matpoltlib, tensorflow 뿐만 아니라 파이썬에서 많이 사용되는 라이브러리들에 대한 튜토리얼들이 정리되어 있습니다.
- Keras Examples
- 케라서 공식 도큐먼트에서 제공되는 example 예제 모음. 300줄 이하의 코드로 구성되어 있으며, 다양한 기본 예제들이 있다.
- 자연어처리 100제
- 자연어 처리 관련된 문제 100제를 풀어보는 사이트
- 자연어(NLP) 처리 기초 정리
- Machine Learning Mastery(영문)
- 머신 러닝 개념을 파이썬 코드를 통해 직접 구현해 볼 수 있습니다. 제공해 주는 Python 코드 예제가 좋습니다.
- Deep Note
- Jupyter Notebook에 도전장을 내미는 데이터 사이언스 Notebook. 궁금하신 분들은 사용해 보시길!
- OpenAI Spinning Up
- OpenAI의 강화 학습 교육 자료
- GUI for TensorFlow
- GUI로 텐서플로우 모델 만들기
- arXiv - 논문저장소
- 논문 저장소. 인공지능, 프로그래밍 등 거의 모든 논문을 찾아볼 수 있다.
- arXiv sanity
- 일정 기간동안 원하는 주제에 대한 인기 있는 arXiv 논문을 볼 수 있다.
위키독스 (Wiki Docs)
-
- 코드, 수학, 토론이 함께하는 대화형 딥러닝 학습서라고 나와있으며, 강력 추천 하고 다만, 한글 번역은 완벽하지 않음. 꼭 한번 살펴 보시길!
-
- 파이썬을 책으로 배우고 싶다면!
-
- 파이썬 기초 문법에 대한 300제 수록.
-
- Andrew Ng 교수님의 강의내용을 정리한 노트. 정말 잘 정리되어 있음.
-
- PyTorch를 위키독스로 배우고 싶다면
-
- 자연어 처리 위키독스 (텐서플로우).
-
- 조경현 교수님의 강의를 정리한 노트.
-
- 증권사 연동 API를 활용한 트레이딩을 가능하게 해주는 파이썬 Wiki!
-
- 하둡, 하이브에 대한 내용 수록
-
빅데이터 - 스칼라(scala), 스파크(spark)로 시작하기
- 스칼라, 스파크를 배우고 싶다면
유튜브 채널 (YouTube Channel)
-
- 인공지능 강의 뿐만아니라 테크 분야의 다양한 분야의 정말 좋은 강의를 무료로 제공합니다.
-
- 재미난 인공지능을 활용한 다양한 프로젝트를 진행해보고 풀이까지 쉽게 제공.
-
- 논문에 대한 리뷰, 구현까지 쉽게 설명해주시는 강의형 영상이 있습니다.
-
- 캐글 커널 리뷰와 다양한 캐글 팁들을 알려주시는 영상으로 구성되어 있는 채널입니다.
-
- 딥러닝 관련 영상들이 많이 게재되어 있으며, 깔끔한 PPT와 쉽고 간결한 설명의 강의 영상들이 많다.
-
- 공돌이의 수학정리노트 블로그에 이은, 쉽게 설명하는 수학 강의 영상 채널.
-
- 머신러닝, 딥러닝 관련 강의를 재밌고, 이해 하기 쉽게 설명하는 유튜브 채널.
-
- 캐글 튜토리얼과 다양한 머신러닝 툴에 대해서도 다룹니다. 차분하게 배워볼 수 있는 유튜브 채널.
-
- 텐서플로우 관련 영상들이 주를 이룹니다. 데이터 분석, 머신러닝, 그리고 딥러닝 주제를 다루는 유튜브 채널.
-
- 머신러닝의 배경이 되는 통계학을 그림과 함께 쉽고 간결하게 설명해 주는 채널.
논문 읽기 (YouTube)
데이터 사이언티스트 스토리 (Data Scientist Story)
코딩하는 테크보이 워니
Data Scientist이지영님
- 비전공자가 데이터사이언티스트로 취업할 수 있는지, 취업 팁 - Data Scientist이지영님
- 데이터 사이언티스트 연봉, 휴가 이직에 대해 - Data Scientist이지영님
- 3년차 데이터과학자가 말하는 이 일이란? - Data Scientist이지영님
터닝포인트TP, 취업 전문 유튜브
- 데이터 사이언티스트 & 머신러닝 엔지니어? 현직자가 모두 알려준다!(ft.자연어 처리10년) - 터닝포인트TP, 취업 전문 유튜브
- 데이터 사이언티스트 연봉? 취업 전망? 10년차 엔지니어가 다 알려줌!! - 터닝포인트TP, 취업 전문 유튜브
- 머신러닝과 데이터사이언티스트 진로? 학벌? 야근? 10년차 전문가가 모두 답변해드립니다!! - 터닝포인트TP, 취업 전문 유튜브
딥러닝호형 DL bro
페이스북 그룹 (Facebook Groups)
- TensorFlow Korea
- 텐서플로우 코리아
- PyTorch KR
- 파이토치 코리아
- Kaggle Korea
- 캐글 코리아
- Recommender System KR
- 추천 시스템
- A.I. Lookbook
- 시각화
- AI Korea
- AI 코리아
- Reinforcement Learning KR
- 강화학습 코리아
- 통계분석연구회
- 통계학 분석 연구회 (Statistics Analysis Study)
- GNN KR
- 그래프 뉴럴 네트워크
오픈데이터
- 공공데이터포털
- Open Data Inception
- AI Hub
- 정부지원 AI 관련 데이터, 소프트웨어, 컴퓨팅 자원지원, 경진대회 등이 존재하는 플랫폼
- Appen
- 오픈데이터를 모아 놓은 깃헙
- VisualData - Vision 관련 데이터셋
- 한국데이터거래소
- Korpora: Korean Corpora Archives - 한글 자연어처리 관련 데이터셋
- KorQuAD2.0 - 한글 질문답변 데이터셋
텐서플로우 자격증
기타
- Udacity: Dog Breed Image Classifier in Pytorch
- TED: Big Data playlist (한국어 자막 지원)
- 데이터 이해하기 (통계, 시각화)