/AIforAll_Team10

[GEK10109 - 01] 2021 AI for All Team Project (Team 10)

Primary LanguagePython

[GEK10109 - 01] 2021 AI for All Team Project (Team 10)

Memebers

  • 21600569 이해찬
  • 21800815 이요한
  • 22100678 정용빈

1. 프로젝트명

  • "딥러닝을 통해 목소리를 만든다고???"

2. 프로젝트 계기

  • AI히든싱어라는 예능 프로그램과 "Age of AI"라는 Youtube Original의 영상을 보면서 직접 TTS를 구현해보는 것은 어떨까 하는 생각에 프로젝트를 기획하게 되었음.

3. 프로젝트 개요

  • 오픈소스로 공개된 AI 모델을 가져와 소개하거나, 이를 활용한 예를 제시하는 프로젝트 본 프로젝트에서는 한동대학교 딥러닝 연구실에서 공개한 FastSpeech2 Korean을 사용함.

  • 한국어 TTS(Text-to-Speech)를 위해 캐글에 공개된 데이터셋인 KSS (Korean Single-Speech) 데이터셋과, 한동대학교 딥러닝 연구실에서 공개한 KSS 데이터셋에 대한 phoneme-utterance sequence간 alignment 정보를 활용하여 모델의 학습을 진행하여 간단한 TTS 모델을 구축하는 프로젝트.

  • 사용되는 TTS 모델: Korean Fast-Speech 2 Microsoft의 Fast-Speech2 모델을 기반으로 한국어 데이터셋에서 사용할 수 있도록 구현된 모델로, non-autoregressive 모델이며 이전의 autoregressive 모델보다 속도 및 성능 면에서 더 나은 TTS 모델이다.

  • 가능하다면 실제 한동대학교 교수님의 허락을 맡아 교수님의 음성 데이터를 활용한 TTS 모델을 구축할 예정입니다.

  • 출처 URL

    (1) https://www.kaggle.com/bryanpark/korean-single-speaker-speech-datast

    (2) https://github.com/HGU-DLLAB/Korean-FastSpeech2-Pytorch

4. 기대효과

  • 현재 우리와 함께하지 못하는 분들의 목소리를 들을 수 있다.
  • 사고로 목소리를 잃으신 분들의 목소리를 다시 들을 수 있다.
  • 추억하는 누군가의 목소리를 원하는 문구 들을 수 있다.
  • 세상에 더 이상 존재 할 수 없는 것을 존재하게 만드는 의미가 있다.

How to Use (to be updated)

Tested Environment

1) Ubuntu 소프트웨어 설치

$ sudo apt install vim
$ sudo apt install git
$ sudo apt install gcc
$ sudo apt insatll g++
$ sudo apt install make

2) Anaconda 설치 및 가상 환경 구축

$ conda create -n py37 python=3.7.10
$ conda activate py37

3) Git Clone

$ cd ~
$ mkdir github
$ cd github
$ git clone https://github.com/iyohan/AIforAll_Team10.git

4) Dependencies 설치

  • 대부분 프로젝트 폴더 (Korean-FastSpeech2-Pytorch 폴더) 내에 있는 requirements.txt를 이용해 설치를 진행하나, 어떤 것들은 직접 설치해야하는 것들 또한 존재함.
$ conda activate py37
$ pip install cmake
$ conda install pythorch==1.6.0 torchvision==0.7.0 -c pytorch
$ conda install -c intel mkl_fft==1.1.0
$ pip install tbb
$ pip install tgt
$ pip install scipy
$ pip install pyworld
$ pip install librosa
$ pip install matplotlib
$ cd ~/github/AIforAll_Team10/Korean-FastSpeech2-Pytorch
$ pip install -r requirements.txt

5) Run