Обучение нейронки

Question

Обучение нейронки

Misterpin opened this issue 4 years ago · 8 comments

Доброго времени суток!
Как начать С НУЛЯ обучать нейронку? (т.е не нужен pretrained model)

Answer 1 · 2020-11-20T18:20:20.000Z

Не скачивать веса

Answer 2 · 2020-11-20T19:08:06.000Z

Насколько я правильно понял, в колабе, который Вы привели как пример, нужно лишь не запускать два блока, где скачивание и распаковка архива pretrained, тогда нейронка обучается с нуля, так? И насколько большой объем файла вместо ex.wav должен быть, чтобы желаемый голос у нейронки был почти идеален?

Answer 3 · 2020-11-20T19:15:05.000Z

Preparing the encoder, the synthesizer and the vocoder...
Traceback (most recent call last):
File "demo_cli.py", line 67, in
encoder.load_model(args.enc_model_fpath)
File "/content/Multi-Tacotron-Voice-Cloning/encoder/inference.py", line 33, in load_model
checkpoint = torch.load(weights_fpath)
File "/usr/local/lib/python3.6/dist-packages/torch/serialization.py", line 581, in load
with _open_file_like(f, 'rb') as opened_file:
File "/usr/local/lib/python3.6/dist-packages/torch/serialization.py", line 230, in _open_file_like
return _open_file(name_or_buffer, mode)
File "/usr/local/lib/python3.6/dist-packages/torch/serialization.py", line 211, in init
super(_open_file, self).init(open(name, mode))
FileNotFoundError: [Errno 2] No such file or directory: 'encoder/saved_models/pretrained.pt'
Ругается что нет предобученной модели

Answer 4 · 2020-11-20T19:17:00.000Z

В калабе нет обучения
Для хорошего качества надо 1000 голосов и 1000 часов записей

Answer 5 · 2020-12-16T20:06:28.000Z

В калабе нет обучения
Для хорошего качества надо 1000 голосов и 1000 часов записей

а есть смысл доучивать pretrained модель которую предоставили? и сколько итераций должно быть для "хорошего качества"?
Есть ли готовая модель, которая хотя бы слегка похоже клонирует русскую речь?

Answer 6 · 2020-12-31T09:31:51.000Z

Добрый день!
А модель encoder, веса к которой вы предоставляете уже дообучена на русской речи или используеться оригинальный encoder с Real-Time-Voice-Cloning? (я знаю, что можно использовать encoder обученый только на англ речи но я использую его для задачи голосовой биометрии и хотел повысить качество эмбедингов дообучив и на русской речи)
Спасибо!

Answer 7 · 2021-08-14T04:32:25.000Z

В калабе нет обучения
Для хорошего качества надо 1000 голосов и 1000 часов записей

А для одного голоса сможет обучится? т.е нужно копирование одного голоса

Answer 8 · 2021-09-30T16:47:57.000Z

Если вам нужно копирование одного голоса - обучите обычный tacotron 2(в идеале 40+ часов).