Реализация модели машинного обучения, определяющей пол говорящего в аудиодорожке с форматом 'wav', сжатие PCM, 8000 Гц, 16 бит.
- Скачиваем проект, переходим в папку с ним
- Удостоверяемся, что имеем версию
Python
>= 3.8.5 - Устанавливаем пререквизиты (если не установлены):
python install -r requirements.txt
GID.zip
: архив с описанием задания и входными данными для обучения моделиGID_test_task.ipynb
: jupyter-ноутбук с исследованием входных данных и обучением моделиbest_model.joblib
: обученная SVM (лучшая из опробованных) модель, сохранённая через joblibscaler.joblib
: обученный стандартизатор входных данных, сохранённый через joblibaudio_parser.py
: методы для обработки звукового .wav файлаtest_gender.py
: метод для тестирования обученной модели на реальных данных
python test_gender.py <путь до папки/файла с .wav>
Формат вывода скрипта: {название файла}->{male/female}