숭실대학교 컴퓨터학부 2018년 1학기 전공종합설계1 프로젝트 팀 저장소입니다.
머신러닝을 활용한 트위터 감정분석 프로젝트
파이썬 : 3.5.2 IDE : 서브라임
pip install tweepy
pip install bs4
pip install pyyaml
pip install pymysql
pip install konlpy
konlpy 설치 방법은 링크
스키마 데이터베이스를 만듧니다.
mysql > create database tweet CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
mysql > use tweet;
테이블을 생성합니다.
mysql > CREATE TABLE posts (
id bigint(20) unsigned NOT NULL AUTO_INCREMENT,
tweet_id bigint(40) unsigned NOT NULL,
text varchar(400) NOT NULL,
created datetime,
PRIMARY KEY (id)
) DEFAULT CHARSET=utf8mb4;
config 파일을 생성하고 다음 정보를 입력합니다.
mysql:
host: 호스트 이름
user: 유저 이름
passwd: 패스워드
db: 디비명
twitter:
consumer_key : ###
consumer_secret : ###
access_token : ###
access_token_secret : ###
트위터 어플리케이션을 생성해 key를 받아와서 입력해 주어야 합니다.
python3 crawling_to_db.py
앞서 posts table을 create하고 crawling_to_db.py를 실행시키면, 원하는 만큼 트윗을 긁어 옵니다. 목표에 따라서 시간이 아주 오래 걸릴 수 있습니다.
python3 testing_konlpy.py
analyzed 테이블에 형태소를 분석한 결과를 넣습니다.
python3 nlp_ml_analysis.py
sentiment 테이블에 분석 결과를 넣습니다.