/kpop_vocal_tagging

Deep Learning for Music and Audio - Final Project

Primary LanguageJupyter Notebook

kpop vocal tagging

Final Project of Deep Learning for Music and Audio

semantic tagging with KVT Dataset

Directory

data
    └ ???
└ utils.py : Loss, Metric 등을 불러오기 위해 정의된다.
└ dataset.py : dataset을 정의한다.
└ model.py : semantic tagging 모델을 정의한다.
└ train.py : dataloader를 불러와 model로 학습을 진행한다.
└ test.py : 학습된 model을 불러오고, inference 내용을 출력한다.\

Model

  • base_model

image

train example

train with learning rate 0.0001 for 5 epochs

python train.py -learning_rate 0.0001 -epoch 5

evaluation

model F-Score Precision Recall
base 0.7489 0.6223 0.9344
resnet 0.7385 0.6050 0.9416
crnn 0.7433 0.6182 0.9261

demo result

image

image