speech-synthesis

Uma interface de síntese de fala, também conhecida como texto para fala (TTS), é uma tecnologia que converte texto escrito em fala artificial, permitindo que computadores, softwares e dispositivos eletrônicos "leiam" em voz alta para os usuários.

O Mozilla oferece uma interface de síntese de fala chamada Web Speech API, que permite integrar essa tecnologia aos seus projetos web e navegadores, e é formada por dois componentes: SpeechRecognition e

O componente SpeechRecognition controla o serviço de reconhecimento de voz. Em alguns navegadores, por exemplo o Chrome, o áudio é enviado para ser processado através de um web servoce, então ele só funciona online.

O componente SpeechSynthesis controla o serviço de fala, e pode ser usado para obter informações sobre as vozes sintetizadas disponíveis no dispositivo, reproduzir e pausar uma locução, além de outros comandos.

Funcionalidades

Este projeto exemplifica como usar o recurso SpeechSynthesis, via javascript, para ler um texto. As funcionbalidades são obter a lista de vozes disponíveis no dispositivo, selecionar uma delas, escolher o tom e a velocidade da fala, aceitar um texto e, finalmente, proceder a leitura deste texto. Os comandos de tela ficam desabilitados enquanto o texto está sendo reproduzido.

Pré-requisitos

Somente um navegador, a interface visual foi feita usando o Bootstrap 5, e o SpeechSynthesis é um recurso nativo do navegador e é acessado por javascript.

Install & Run

No terminal, digitar:

git clone git clone http://github.com/gtnasser/speech-synthesys
cd speech-synthesys

Abrir o arquivo html utilizando um navegador

No windows pode-se clicar duas vezes no arquivo index.html ou ainda no terminal, digitar:

start index.html