Projeto Reconhecimento de Audios

Para este projeto e necessario que as pastas com os dados de treino, validacao e teste estejam nas pastas 'TREINAMENTO/', 'VALIDACAO/' e 'TESTE/', respectivamente, dentro da pasta principal do projeto.
Os dados devem estar formato .wav e duracao maxima de ~ 8s.

Apos configurar as pastas com os dados para executar o projeto em modo de validação, basta realizar o comando abaixo. Nesta opção, os dados de teste não são utilizados, apenas os dados nas pastas de treino e de validação.

     python project.py 0

Para executar em modo de teste, basta realizar o comando abaixo. Nesta opção, o programa também utiliza os dados de validação para treinar.

     python project.py 1

Tomar o devido cuidado para nao executar utilizando python 2.
Os testes foram realizados tendo o Python 3.6. Caso essa versão não seja a default do sistema, basta executar o seguinte comando no terminal:

     python3.6 project.py 0
     python3.6 project.py 1

Para o classificador Random Forest obtivemos uma taxa de acerto de aproximadamente 74% (Nath: 73,88% com shuffle e 73,97% sem shuffle), para 500 estimators e max_depth = 50.
Para o classificador SVC (kernel linear) obtivemos uma taxa de acerto de aproximadamente 60% (Nath: 59,88% aplicando shuffle nos files e 59,93% sem aplicar).
Para o classificador KNN (3 neighbours) obtivemos uma taxa de acerto de aproximadamente 57% (Nath: 57,4%).
Em todos os classificadores a taxa de acerto dos caracteres n, m, d e b foi mais baixa que a dos demais.

r-baisso/audio_captcha_recog