Не видит dataset

Question

Не видит dataset

videoprice opened this issue 5 years ago · 3 comments

Привет, у меня не видит dataset RU. LibriSpeech видит, а русский dataset не видит. Что делать? Спасибо

Answer 1 · 2020-03-05T06:43:58.000Z

У разных датасетов разная структура.
В synthesizer_preprocess_audio замените preprocess_sst на preprocess_librispeech.
Под свой датасет можете настроить \synthesizer\preprocess.py

Answer 2 · 2020-03-05T16:54:33.000Z

Спасибо за помощь, но ничего не выходит, не видит toolbox хоть убей:( Я хочу настроить dataset под RUSLAN https://ruslan-corpus.github.io/
Не покажете, как будет выглядить \synthesizer\preprocess.py под этот конкретный dataset
Огромное спасибо Владислав

Answer 3 · 2020-03-05T17:32:46.000Z

toolbox нужен уже для использования. Какой там вообще смысл открывать весь датасет? Можно отдельные файлы. Но если очень надо, можно отредактировать toolbox/init.py
И я не правильно прочитал, для тренировки синтезатора голосом RUSLAN нужно в synthesizer_preprocess_audio заменить preprocess_sst на preprocess_book. И тогда а сам датасет поместить в папку book (по умолчанию). Если надо, настраивается сама обработка в \synthesizer\preprocess.py