1주차는 간단한 형태소 분석을 시행하였다.
Zipf's Law 이에대해 학습하였다.
word2vector에 대한 실습과 이에대해 코사인 유사도를 구해보았다.
bert모델을 이용하여 네이버 영화리뷰 감성분류 모델을 만들어보았다.
과제로는 모델자체의 성능을 끌어올리는거였고 전처리부분에서 손을 보아 성능을 개선시켰다.
Tabluar Parsing에 대해 학습하였다
이를 통해 들어오는 어절을 자소(jaso)단위로 끊어서 접속정보와 사전정보를 통해 의미단위로 분석할 수 있었다.
알고리즘으로는 backtracking을 사용하여 2차원 배열을 통해 parsing하면서
jaso단위로 쪼갠것을 하나하나 붙이면서 확인하는과정이다.