/soapt_project

전공종합설계 프로젝트 팀입니다.

Primary LanguagePython

soapt_project

숭실대학교 컴퓨터학부 2018년 1학기 전공종합설계1 프로젝트 팀 저장소입니다.

개요

머신러닝을 활용한 트위터 감정분석 프로젝트

개발환경

파이썬 : 3.5.2 IDE : 서브라임

라이브러리

pip install tweepy
pip install bs4
pip install pyyaml
pip install pymysql
pip install konlpy

konlpy 설치 방법은 링크

DB 생성

스키마 데이터베이스를 만듧니다.

mysql > create database tweet CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
mysql > use tweet;

테이블을 생성합니다.

mysql > CREATE TABLE posts ( 
  id bigint(20) unsigned NOT NULL AUTO_INCREMENT,
  tweet_id bigint(40) unsigned NOT NULL,
  text varchar(400) NOT NULL,
  created datetime,
  PRIMARY KEY (id)
) DEFAULT CHARSET=utf8mb4;

config 파일 생성

config 파일을 생성하고 다음 정보를 입력합니다.

mysql:
    host: 호스트 이름
    user: 유저 이름
    passwd: 패스워드
    db: 디비명
twitter:
    consumer_key : ###
    consumer_secret : ###
    access_token : ###
    access_token_secret : ###

트위터 어플리케이션을 생성해 key를 받아와서 입력해 주어야 합니다.

트위터에서 크롤링 해오기

python3 crawling_to_db.py

앞서 posts table을 create하고 crawling_to_db.py를 실행시키면, 원하는 만큼 트윗을 긁어 옵니다. 목표에 따라서 시간이 아주 오래 걸릴 수 있습니다.

형태소 분석하기

python3 testing_konlpy.py

analyzed 테이블에 형태소를 분석한 결과를 넣습니다.

각 문장과 감정의 관계 분석 및 점수화

python3 nlp_ml_analysis.py

sentiment 테이블에 분석 결과를 넣습니다.