- Para este projeto e necessario que as pastas com os dados de treino, validacao e teste estejam nas pastas 'TREINAMENTO/', 'VALIDACAO/' e 'TESTE/', respectivamente, dentro da pasta principal do projeto.
- Os dados devem estar formato .wav e duracao maxima de ~ 8s.
- librosa
- glob
- random
- pandas
- numpy
- matplotlib
- re
- sklearn
- scipy (not used anymore)
- math (not used anymore)
- Apos configurar as pastas com os dados para executar o projeto em modo de validação, basta realizar o comando abaixo. Nesta opção, os dados de teste não são utilizados, apenas os dados nas pastas de treino e de validação.
python project.py 0
- Para executar em modo de teste, basta realizar o comando abaixo. Nesta opção, o programa também utiliza os dados de validação para treinar.
python project.py 1
-
Tomar o devido cuidado para nao executar utilizando python 2.
-
Os testes foram realizados tendo o Python 3.6. Caso essa versão não seja a default do sistema, basta executar o seguinte comando no terminal:
python3.6 project.py 0
python3.6 project.py 1
-
Para o classificador Random Forest obtivemos uma taxa de acerto de aproximadamente 74% (Nath: 73,88% com shuffle e 73,97% sem shuffle), para 500 estimators e max_depth = 50.
-
Para o classificador SVC (kernel linear) obtivemos uma taxa de acerto de aproximadamente 60% (Nath: 59,88% aplicando shuffle nos files e 59,93% sem aplicar).
-
Para o classificador KNN (3 neighbours) obtivemos uma taxa de acerto de aproximadamente 57% (Nath: 57,4%).
-
Em todos os classificadores a taxa de acerto dos caracteres n, m, d e b foi mais baixa que a dos demais.