/DLTON

DKTC (Dataset of Korean Threatening Conversations) 데이터를 활용한 테스트 데이터 다중분류 프로젝트

Primary LanguageJupyter Notebook

AIFFEL Campus Online 5th NLP DLTON

모두의 연구소 주최 아이펠 온라인 5기 리서치 과정 NLP competition

DKTC (Dataset of Korean Threatening Conversations) 데이터를 활용한 테스트 데이터 다중분류 프로젝트

프로젝트 진행 과정 및 회고 내용

2023 AIFFEL DLTON NLP 과정 후기

프로젝트 구성

  • folders📂
    • data: 제공받은 데이터셋
    • submission: 모델을 통해 제작된 submission 파일들
  • files📃
    • EDA: EDA 진행한 노트북
    • tokenize: 토큰화 진행 노트북. mecab, okt를 사용해 토큰화 수행
    • BERT_acc_0.9: 리더보드 스코어 0.9가 나온 bert 모델
    • korean_stopwords: 불용어 파일
    • LSTM_acc_0.56: 훈련 데이터 스코어 0.56이 나온 lstm 모델
    • DLTON AIFFEL ONLINE 5기 NLP: 발표자료