Для того, чтобы скачать датасет, необходимо запустить файл download.py
с некоторыми аргументами:
python3 download.py --dataset mtedx --root-path your/path/to/download/folder --src-lang ru
Обязательные аргументы:
--dataset
- название датасета--root-path
- путь до местоположения загрузки датасета--src-lang
- язык датасета
Необязательные аргументы:
--download
- требуется ли загрузка сжатого датасета. По умолчанию - True, однако если у вас уже скачан датасет, и вы хотите скачать только видео - передайте--download 0
--num-workers
- количество параллельных процессов
python prepare_mtedx.py --root-dir "/media/sadevans/T7/ЛИЧНОЕ/Diplom/datsets/mTedx/ru-ru/preproc" --dataset "mtedx_ru" --downloaded-path "/media/sadevans/T7/ЛИЧНОЕ/Diplom/datsets/mTedx" --seg-duration 24 --src-lang "ru"