/VocalAssignment-SSCS

Trabalho de Conclusão de Curso (Final Undergraduate Project). Contributions and enhancements to the VoasCNN architecture described in the paper “Voice Assignment in Vocal Quartets Using Deep Learning Models Based on Pitch Salience”.

Primary LanguageJupyter Notebook

Transcrição de notas musicais de quartetos a cappella

Neste projeto (in this project):

NumPy Pandas Matplotlib TensorFlow Docker

Aplicação web (webapp):

HuggingFace


🇧🇷

Este é o repositório do Trabalho de Conclusão de Curso em Engenharia de Computação do aluno André Paiva Conrado Rodrigues, pela Universidade Federal da Bahia (UFBA).

O trabalho consiste em contribuições com técnicas de Aprendizagem Profunda para a tarefa de associação de vozes, utilizada na transcrição de notas musicais a partir de arquivos de áudio contendo performances de quartetos a cappella.

Uma aplicação de fácil uso foi disponibilizada no HuggingFace. Para usar a aplicação, clique aqui. Basta carregar um arquivo de música a cappella (em qualquer formato) e a aplicação retornará arquivos MIDI, CSV e HDF5 contendo a transcrição aproximada de notas musicais das quatro vozes (Soprano, Contralto, Tenor e Baixo).

Neste repositório, constam os códigos-fonte dos modelos, das experimentações, dos algoritmos de avaliação de desempenho, plotagem de gráficos, dentre outros.

O nome da monografia é Segmentação de trajetórias de frequência fundamental e associação de vozes para transcrição de performances musicais de quartetos a cappella. A monografia na íntegra está disponível em https://repositorio.ufba.br/handle/ri/38854.


🇬🇧

This is the repository of the Final Undergraduate Project in Computer Engineering by student André Paiva Conrado Rodrigues, from the Federal University of Bahia (UFBA).

This projects consists in contributions to Deep Learning architectures for the task of voice assignment, applied to pitch transcription of audio files containing musical performances of a cappella quartets.

An application was deployed at HuggingFace. To use the app, click here. You only need to upload an audio file (any format) and the application will return MIDI, CSV and HDF5 containing approximated pitch transcription of four voices (Soprano, Alto, Tenor and Bass).

This repository contains the source codes for models, experiments, performance evaluation algorithms, graph plotting, among other things.

The name of the monograph is Segmentation of F0 trajectories and voice assignment for transcription of musical performances by a cappella quartets. The full monograph is available at https://repositorio.ufba.br/handle/ri/38854, in Brazilian Portuguese.


Apresentação do TCC no Youtube (clique na imagem para assistir)

Apresentação do TCC no Youtube