- Korean Emotion Classification using audio, text
- using data 감정 분류를 위한 대화 음성 데이터셋 ai hub link
- code reference link
- 파일 구성
- data 폴더
- 5차_wav: ai hub 데이터 다운 저장 위치
- 5차_10011.csv: wav_id따른 텍스트 정보
- final_df.csv: sampling한 데이터 오디오 feature를 저장한 데이터
- model 폴더
- encoder.pkl: 인코더 모델
- my_model.h5: 감정 분류 모델
- scaler.pkl: 스케일러 모델
- text_model_name.txt: 사용한 sbert 모델
- 1. preprocessing.ipynb: wav파일 샘플링 및 feature 추출 및 저장
- 2. modeling.ipynb: tensorflow==2.10.1 로 모델 학습 및 저장
- 학습 환경
- python==3.10
- tensorflow==2.10.1
- keras==2.10.0
- 학습 환경
- 3. predict.ipynb: cpu환경에서 모델 불러오기 및 새로운 데이터 예측 예시 노트북 파일
- 예측 환경
- python==3.10
- tensorflow-cpu==2.10.1
- keras==2.10.0
- 예측 환경
- utils.py: 함수 저장 파일
- data 폴더