Multi-Tacotron Voice Cloning (TensorFlow 2.x support)

This is a fork of Multi-Tacotron-Voice-Cloning that includes support for Tensorflow 2. This repository is a phonemic multilingual (Russian-English) implementation based on Real-Time-Voice-Cloning. it is a four-stage deep learning framework that allows to create a numerical representation of a voice from a few seconds of audio, and to use it to condition a text-to-speech model. If you only need the English version, please use the original implementation.

Это форк Multi-Tacotron-Voice-Cloning, который включает поддержку Tensorflow 2. Этот репозиторий является многоязычной (русско-английской) фонемной реализацией, основанной на Real-Time-Voice-Cloning. Она состоит из четырёх нейронных сетей, которые позволяют создавать числовое представление голоса из нескольких секунд звука и использовать его для создания модели преобразования текста в речь

Examples

Use this Kaggle notebook to test fork: link (Note that I have only tested on CPU so far, the process in notepad takes some time)

Contribution

For feedback on the original project: niw9102@gmail.com, for this fork: brasd99@gmail.com

Additional Information

For more information, please refer to the original repository Multi-Tacotron-Voice-Cloning