/WAV_Gender_Determinator

Модель машинного обучения для определения пола по .wav файлу

Primary LanguageJupyter Notebook

Определитель пола по .wav файлу

Реализация модели машинного обучения, определяющей пол говорящего в аудиодорожке с форматом 'wav', сжатие PCM, 8000 Гц, 16 бит.

Подготовка

  1. Скачиваем проект, переходим в папку с ним
  2. Удостоверяемся, что имеем версию Python >= 3.8.5
  3. Устанавливаем пререквизиты (если не установлены):
python install -r requirements.txt

Что есть что

  • GID.zip: архив с описанием задания и входными данными для обучения модели
  • GID_test_task.ipynb: jupyter-ноутбук с исследованием входных данных и обучением модели
  • best_model.joblib: обученная SVM (лучшая из опробованных) модель, сохранённая через joblib
  • scaler.joblib: обученный стандартизатор входных данных, сохранённый через joblib
  • audio_parser.py: методы для обработки звукового .wav файла
  • test_gender.py: метод для тестирования обученной модели на реальных данных

Как тестировать модель

python test_gender.py <путь до папки/файла с .wav>

Формат вывода скрипта: {название файла}->{male/female}