/DCASE2016-1

声音场景识别

Primary LanguagePython

DCASE2016

声音场景识别 DCASE2016

  • 任务介绍以及数据库下载:http://www.cs.tut.fi/sgn/arg/dcase2016/task-acoustic-scene-classification
  • 依赖库:numpy、scipy、librosa、keras、tensorflow or theano
  • 实验采用Mel能量谱+CNN+随机森林
  • 试验的confuse matrix如下:
  • image
  • cnn本身的feature map特征其实是非常稀疏的、即使采用过拟合手段有dropout,交叉验证、早停法、权重衰减、正则化,仍然有一些数值较低的权重,而不是0。
  • 在有噪声的情况下(场景声音混杂了其他声音事件、如交谈声、风声等),很多神经元节点其实本身的权重都不会偏向0,而是以一个较小的值存在、本实验**主要尝试使用随机森林的自助重采样,直接摒弃部分CNN的冗余特征构建决策树、bagging方式实现声音场景的识别,而未被采样到的袋外数据可以做validation data。