MAI_voice_dataset

Набор аудиозаписей, состоящий из 10 русских слов. Каждое из слов произнесено обычно, быстро и при фоновом шуме.

  1. Окно
  2. Двенадцать
  3. Двадцать
  4. Компьютер
  5. Распространение
  6. Дверь
  7. Дом
  8. Молоко
  9. Программа
  10. Канистра
Каждое слово произнесено по 15 раз каждым из 60 говорящих.
Все записи монофонические.
Частота дикретизации разная, но не меньше 11025 Гц.
Система наименования: №слова_№диктора (№п/п)

Dataset which cosits of 10 russian words. Each word is pronounced usually, quickly and with background noise.
  1. Window [okno]
  2. Twelve [dvenadcat]
  3. Twenty [dvadcat]
  4. Computer
  5. Destribution [rasprostranenie]
  6. Door [dver]
  7. House [dom]
  8. Milk [moloko]
  9. Programm
  10. Fuel tank [kanistra]
Each word is spoken 15 times by each of the 60 speakers.
All recordings are monophonic.
The sampling rate is different, but not less than 11025 Hz.
Name of file: №word_№speaker (number)