yeftakun/voice-recognition

Voice Recognition System using MFCC features and LSTM models for individual identification

Python

Voice Recognition

Dataset

Rekam dataset

(mic saya burik, jadi rada" pas nyoba):

file enrol.py, masukan dulu nama individunya.
Setelah tekan "Mulai Perekaman" suara langsung direkam. Tekan "Stop" untuk berhenti.
Ulangi langkah 2 untuk menambahkan file suara.
Upload gambar profile.
Simpan data untuk menyimpan individu. Batal untuk menghapus.

Buat dataset:

Audio file yang mengandung voice karakter/individunya
Remove noise/bgm di Vocal Remover
Tempatkan dataset seperti dibawah

dataset/
│
├── bocchi/
│   ├── voice1.mp3
│   ├── voice2.mp3
│   ├── voice3.mp3
│   └── profile.jpg
│
├── nijika/
│   ├── voice1.mp3
│   ├── voice2.mp3
│   ├── voice3.mp3
│   └── profile.jpg
│
└── susman-from-mic/
    ├── voice1.mp3
    ├── voice2.mp3
    ├── voice3.mp3
    ├── voice4.mp3
    └── profile.jpg

Memulai

Sesuaikan file .env.
Jalankan training.py.
Pastikan sudah menambahkan file voice input di audio/ dan sesuaikan INPUT_FILE pada .env
Jalankan main.py untuk testing.