/ESC-50-Audio-classification

基于ESC-50的音频分类(Audio classification)

Primary LanguagePython

ESC-10数据集的音频分类

本文选取了ESC-10数据集作为音频分类的数据集,选取了四种方法进行分类,包括支持向量机(SVM),决策树(CLF),多层感知机(MLP),循环神经网络(RNN)。最终支持向量机取得了最优的结果(0.825)。

多层感知机(MLP)

学习率设置为0.001,优化算法选择Adam,损失函数为交叉熵函数,训练10个epoch的损失函数变化如下所示:

训练集上的损失函数:

测试集上的损失函数:

测试集上的准确率:

循环神经网络(RNN)

训练集上的损失函数:

测试集上的损失函数:

测试集上的准确率:

总结

支持向量机(SVM) 决策树(CLF) 多层感知机(MLP) 循环神经网络(RNN)
特征 mfcc,chroma,melspectrogram,contrast,tonnetz mfcc,chroma,melspectrogram,contrast,tonnetz mfcc,chroma,melspectrogram,contrast,tonnetz mfcc
特征维度 (1,45) (1,5) (1,45) (431, 20)
准确率 0.825 0.650 0.762 0.750