/text-mining-course

Python을 활용한 텍스트 분석 실무를 위한 과정에 대해 다룹니다.

Primary LanguageJupyter NotebookApache License 2.0Apache-2.0

TEXT MINING COURSE

  • 실습과제는 상황에 따라 변경될 수 있습니다.

Curriculum

WEEK 01. Python 기초문법 알아보기

  • 강의개요 소개
  • 비정형 텍스트 데이터 분석 기본개념
  • 실습

    실습환경: Python 3.7 & Google Colaboratory
    W01-1. 텍스트 데이터를 다루기 위한 Python: 기본문법
    W01-2. 텍스트 데이터를 다루기 위한 Python: 자료구조
    W01-3. 텍스트 데이터를 다루기 위한 Python: 반복문과 조건문
    TASK 01: 노래 가사에서 한글과 영어 단어 개수 세기

WEEK 02. Python으로 텍스트 데이터 다루기

  • 텍스트 데이터 실무 활용사례
  • 실습

    W02-1. 텍스트 데이터를 다루기 위한 Python: 정규식
    W02-2. 텍스트 데이터를 다루기 위한 Python: 파일 입출력
    W02-3. 텍스트 데이터를 다루기 위한 Python: Numpy 패키지 익히기
    W02-4. 텍스트 데이터를 다루기 위한 Python: Pandas 패키지 익히기
    W02-5. 텍스트 데이터를 다루기 위한 Python: Matplotlib 패키지 익히기

  • 시청각 자료: 뜻밖의 텍스트 마이닝, 네오플

WEEK 03. 텍스트 데이터 수집하기

WEEK 04. 웹크롤링 실전 활용 & 텍스트 데이터 전처리 이해하기

  • 텍스트 데이터 전처리 소개
  • 실습

    W04-1. 동적페이지 수집하기: Requests
    W04-2. 동적페이지 수집하기: Selenium
    W04-3. 기타 데이터에서 텍스트 추출하기

WEEK 05. 텍스트 데이터 전처리 실전 적용하기

WEEK 06. 텍스트 데이터 분석하기: 단어 가중치

WEEK 07. 텍스트 데이터 분석하기: 단어 네트워크

WEEK 08. 텍스트 데이터 분석하기: 군집화

  • 단어/문서 군집화
  • 토픽모델링
  • 실습

    W08-1. 뉴스기사 군집화로 이슈 모아보기
    W08-2. 뉴스기사에서 주제 찾아내기

WEEK 09. 텍스트 데이터 분석하기: 감성분석 & 키워드추출

WEEK 10. 텍스트 데이터 분석하기: 단어 임베딩

  • 단어 임베딩: Word2Vec, Glove
  • 단어와 문서를 벡터로 표현하는 방법: Word2Vec, Doc2Vec
  • 실습

    W10-1. 뉴스기사 텍스트 데이터를 벡터로 표현하기
    W10-2. 위키피디아 텍스트 데이터를 벡터로 표현하기

  • 참고 사이트: http://word2vec.kr/

WEEK 11. 텍스트 데이터로 머신러닝/딥러닝 적용하기

  • 비정형 데이터와 머신러닝
  • 실습

    W11-1. Keras를 이용한 Text Classification 1
    W11-2. Keras를 이용한 Text Classification 2
    W11-3. Keras를 이용한 단어 임베딩 생성
    W11-4. Keras RNN을 이용한 Text Classification 3 Colab
    W11-5. Keras RNN을 이용한 Text Generation Colab

WEEK 12. 비정형 데이터 분석 리뷰

  • 비정형 데이터 분석 리뷰
  • 실습

    W12-1. TBD


References

본 강의자료는 아래 문헌들을 참고해 구성되었습니다.