deepxzy/ESC-50-Audio-classification

基于ESC-50的音频分类（Audio classification）

Python

ESC-10数据集的音频分类

本文选取了ESC-10数据集作为音频分类的数据集，选取了四种方法进行分类，包括支持向量机(SVM)，决策树(CLF)，多层感知机(MLP)，循环神经网络(RNN)。最终支持向量机取得了最优的结果（0.825）。

多层感知机（MLP）

学习率设置为0.001，优化算法选择Adam，损失函数为交叉熵函数，训练10个epoch的损失函数变化如下所示：

训练集上的损失函数:

测试集上的损失函数:

测试集上的准确率:

循环神经网络（RNN）

训练集上的损失函数:

测试集上的损失函数:

测试集上的准确率:

总结

	支持向量机(SVM)	决策树(CLF)	多层感知机(MLP)	循环神经网络(RNN)
特征	mfcc，chroma，melspectrogram，contrast，tonnetz	mfcc，chroma，melspectrogram，contrast，tonnetz	mfcc，chroma，melspectrogram，contrast，tonnetz	mfcc
特征维度	（1，45）	（1，5）	（1，45）	（431, 20）
准确率	0.825	0.650	0.762	0.750