/deep_speech_2_korean

한국어 음성 인식을 위한 deep speech 2

Primary LanguagePythonMIT LicenseMIT

Intro

deep speech를 통해 한국어 E2E(end to end) ASR를 연습하는 프로젝트 입니다.

코드 : https://github.com/SeanNaren/deepspeech.pytorch

논문 링크 : https://arxiv.org/abs/1512.02595

Paper review

Wiki 부분에 논문을 읽고 간단히 정리했습니다.

링크 : https://github.com/fd873630/deep_speech_2_korean/wiki/Deep-speech-2-%EB%A6%AC%EB%B7%B0-(with-code)

Data set

이 프로젝트에서는 AI Hub에서 제공하는 '한국어 음성데이터'를 사용하였습니다. AI Hub 음성 데이터는 다음 링크에서 신청 후 다운로드 하실 수 있습니다.

AI Hub 한국어 음성 데이터 : http://www.aihub.or.kr/aidata/105 ex) KsponSpeech_Filenum.pcm KsponSpeech_Filenum.txt

Preprocessing

https://github.com/sooftware/KoSpeech/wiki/Preparation-before-Training

다음을 참조하여 작성하였습니다.

작성에 도움주신 Kim Soohwan께 감사드립니다.

자세한 내용은 wiki에 기술해 놓겠습니다.

Contacts

해당 작업에 대한 피드백, 문의사항 모두 환영합니다.

fd873630@naver.com 로 메일주시면 감사하겠습니다.

인하대학교 전자공학과 4학년 정지호