- 주어진 recipe를 통해 11가지의 cuisine으로 분류한다.
- 개인프로젝트 (기간: 2017.08.21~2017.08.25)
- f1 score를 최대한 높인다.
다음과 같은 두 가지 방법으로 진행했습니다.
첫째, tfidfVectorizer로 수치화 한 뒤 모델링
둘째, PCA기법으로 차원을 축소한 뒤 모델링
- 최적의 parameter를 구하기 위해 grid search를 이용했습니다.
- KNN, SVM, Randomforest, Xgboost, Neural Network 총 6가지의 분류 모델을 사용했습니다.
- tfidfVectorizer를 이용하여 데이터를 수치로 변환한 뒤, Xgboost 모델을 쓴 경우 0.778로 가장 높은 score를 기록했습니다.