파이썬 딥러닝(deep learning) 라이브러리 keras를 이용한 자연어 처리(NLP) 프로젝트 입니다.
- 뉴스 데이터를 통한 카테고리 예측
- 카테고리를 예측하는데 있어 사용한 tf-idf 값 추론
- 대표 tf-idf 데이터에 대한 연관 단어 추출 및 시각화
사용된 데이터
18년 6월 ~ 10월 까지 뉴스 데이터 (정치, 경제, IT, 연예) 200만개
웹 프레임워크 파이썬 Django
사용된 라이브러리
sklearn-learn keras word2vec(gensim) pandas, numpy etc..