/Audio_processing_practice

취미로 공부하고 있는 음성 처리 관련 스크립트들을 모아두는 리포지토리입니다. 음성 처리에 관련한 Feature 추출, 라이브러리 사용법 등이 있습니다.

Primary LanguageJupyter Notebook

Audio_processing_practice

취미로 공부한 음성 처리 관련 스크립트들을 올리는 리포지토리입니다.

1. 해당 폴더의 파일 목록은 다음과 같습니다.

1. FFT.ipynb : 고속 푸리에 변환 (Fast Fourier Transform)을 Python에서 어떻게 사용하는지, 어떤 변환을 수행하는지 공부하기 위한 파일입니다.
https://techreviewtips.blogspot.com/2017/11/05-02-fft.html
의 코드를 참고하였습니다.

2. MFCC.ipynb : 음성 처리에서 자주 사용되는 Feature인 MFCC를 추출하는 방법에 대해 알아보기 위한 파일입니다.
MFCC를 구하기 위해 Mel Spectrum의 계산 또한 필수적이므로, Mel / Log Mel Spectrum 의 내용도 같이 찾아보실 수 있습니다.
https://ratsgo.github.io/speechbook/docs/fe/mfcc
https://youtu.be/jYgMMy8KAc0
의 코드와 강의를 참고하였습니다.

3. music_classification.ipynb : 파이썬 라이브러리를 사용하여 간단하게 음원을 분석하고, Classifiation, 유사 음원 추천 시스템을 만들어 보는 스크립트입니다.
https://jonhyuk0922.tistory.com/m/114
의 코드를 참고하였습니다.