DKTC (Dataset of Korean Threatening Conversations) 데이터를 활용한 테스트 데이터 다중분류 프로젝트
- folders📂
- data: 제공받은 데이터셋
- submission: 모델을 통해 제작된 submission 파일들
- files📃
- EDA: EDA 진행한 노트북
- tokenize: 토큰화 진행 노트북. mecab, okt를 사용해 토큰화 수행
- BERT_acc_0.9: 리더보드 스코어 0.9가 나온 bert 모델
- korean_stopwords: 불용어 파일
- LSTM_acc_0.56: 훈련 데이터 스코어 0.56이 나온 lstm 모델
- DLTON AIFFEL ONLINE 5기 NLP: 발표자료