로봇의 감정 및 개성을 표현할 수 있는 대화형 음성코퍼스 DB

본 한국어 음성 DB는 산업통상자원부의 산업기술혁신사업으로부터 지원을 받아 한국과학기술원의 주관하에 (주)셀바스AI가 구축한 결과물이므로 연구 목적으로만 활용이 가능하고 상업을 목적으로 활용은 불가함. (No. 10080667, 음원 다양화를 통하여 로봇의 감정 및 개성을 표현할 수 있는 대화음성합성 원천기술 개발)

NOTICE

본 Repository는 아래 기술된 전체 데이터의 5%만 공개된 것이며, 전체 데이터가 활용하고자 하는 기업 또는 개인은 신청서 작성하여 제출해야함. 이후 별도의 심사를 거쳐 자료 제공 여부가 결정되며 미승인시 자료 제공이 거절될 수 있음.

DATASET

o 언   어 : 한국어
o 제 작 일 : 2017 ~ 2018년
o 발성목록 : 낭독체, 대화체
o DB 구성 및 화자수 
	1) 기본화자 : 여성 1인
	2) 평균음성모델 개발용 : 여성 4인
	3) 화자적응 학습 및 테스트용 : 여성 2인, 남성 2인
	4) 감정 표현 기술 연구를 위한 연구용 DB (일반 대본) : 여성 2인, 남성 3인
		: 일반 대본에 감정을 부여하여 녹음.
		: 일반, 기쁨, 화남, 슬픔		
	5) 감정 표현 기술 연구를 위한 연구용 DB (감정 대본) : 여성 5인, 남성 5인
		: 감정 대본을 사용하여 녹음.
		: 일반, 기쁨, 화남, 슬픔		
o 음성데이터 파일형식 : PCM WAVE signed 16bits, 22.05kHz, mono
o 데이터량
	1) 기본화자(여성)
		: 6.500문장(낭독체 1,000문장, 대화체 5,500문장)
		: 음성데이터, 녹음 대본, 대본 철자전사
	2) 평균음성모델 개발용
		: 500문장 x 4명
		: 음성데이터, 녹음 대본, 대본 철자전사
	3) 화자적응 학습 및 테스트용
		: 100문장 x 4명
		: 음성데이터, 녹음 대본, 대본 철자전사
	4) 감정 표현 기술 연구를 위한 연구용 DB (일반 대본)
		: 400문장(감정별 100문장) x 5명
		: 음성데이터, 녹음 대본, 대본 철자전사
	5) 감정 표현 기술 연구를 위한 연구용 DB (감정 대본)
		: 400문장(감정별 100문장) x 10명
		: 음성데이터, 녹음 대본, 대본 철자전사


o 디렉토리의 내용
	1) main	- 기본화자(여성)
		lmy/ - 기본화자 디렉토리	
			wav/ - 기본화자 음성 데이터
				: lmy00001.wav ~ lmy06500.wav
			script/ - 기본화자 녹음 대본(UTF-8)
				: lmy00001.txt ~ lmy06500.txt
			transcript/ - 기본화자 녹음 대본 철자전사(UTF-8)
				: lmy00001.txt ~ lmy06500.txt


	2) average_voice_model - 평균음성모델 개발용
		ava/ - 평균음성모델 A화자(여성) 디렉토리 
			wav/ - 평균음성모델 A화자 음성 데이터
				: ava00001.wav ~ ava00500.wav
			script/ - 평균음성모델 A화자 녹음 대본(UTF-8)
				: ava00001.txt ~ ava00500.txt
			transcript/ - 평균음성모델 A화자 녹음 대본 철자전사(UTF-8)
				: ava00001.txt ~ ava00500.txt

		avb/ - 평균음성모델 B화자(여성) 디렉토리 
			wav/ - 평균음성모델 B화자 음성 데이터
				: avb00001.wav ~ avb00500.wav
			script/ - 평균음성모델 B화자 녹음 대본(UTF-8)
				: avb00001.txt ~ avb00500.txt
			transcript/ - 평균음성모델 B화자 녹음 대본 철자전사(UTF-8)
				: avb00001.txt ~ avb00500.txt

		avc/ - 평균음성모델 C화자(여성) 디렉토리 
			wav/ - 평균음성모델 C화자 음성 데이터
				: avc00001.wav ~ avc00500.wav
			script/ - 평균음성모델 C화자 녹음 대본(UTF-8)
				: avc00001.txt ~ avc00500.txt
			transcript/ - 평균음성모델 C화자 녹음 대본 철자전사(UTF-8)
				: avc00001.txt ~ avc00500.txt

		avd/ - 평균음성모델 D화자(여성) 디렉토리 
			wav/ - 평균음성모델 D화자 음성 데이터
				: avd00001.wav ~ avd00500.wav
			script/ - 평균음성모델 D화자 녹음 대본(UTF-8)
				: avd00001.txt ~ avd00500.txt
			transcript/ - 평균음성모델 D화자 녹음 대본 철자전사(UTF-8)
				: avd00001.txt ~ avd00500.txt

	3) adaptive - 화자적응 학습 및 테스트용
		ada/ - 화자적응 A화자(여성) 디렉토리 
			wav/ - 화자적응 A화자 음성 데이터
				: ada00001.wav ~ ada00100.wav
			script/ - 화자적응 A화자 녹음 대본(UTF-8)
				: ada00001.txt ~ ada00100.txt
			transcript/ - 화자적응 A화자 녹음 대본 철자전사(UTF-8)
				: ada00001.txt ~ ada00100.txt

		adb/ - 화자적응 B화자(여성) 디렉토리 
			wav/ - 화자적응 B화자 음성 데이터
				: adb00001.wav ~ adb00100.wav
			script/ - 화자적응 B화자 녹음 대본(UTF-8)
				: adb00001.txt ~ adb00100.txt
			transcript/ - 화자적응 B화자 녹음 대본 철자전사(UTF-8)
				: adb00001.txt ~ adb00100.txt

		adc/ - 화자적응 C화자(남성) 디렉토리 
			wav/ - 화자적응 C화자 음성 데이터
				: adc00001.wav ~ adc00100.wav
			script/ - 화자적응 C화자 녹음 대본(UTF-8)
				: adc00001.txt ~ adc00100.txt
			transcript/ - 화자적응 C화자 녹음 대본 철자전사(UTF-8)
				: adc00001.txt ~ adc00100.txt

		add/ - 화자적응 D화자(남성) 디렉토리 
			wav/ - 화자적응 D화자 음성 데이터
				: add00001.wav ~ add00100.wav
			script/ - 화자적응 D화자 녹음 대본(UTF-8)
				: add00001.txt ~ add00100.txt
			transcript/ - 화자적응 D화자 녹음 대본 철자전사(UTF-8)
				: add00001.txt ~ add00100.txt


	4) plain-to-emotional : 감정 표현 기술 연구를 위한 연구용 DB (일반 대본)
		ema/ - 감정연구용 A화자(여성) 디렉토리 
			wav/ - 감정연구용 A화자 음성 데이터
				: ema00001.wav ~ ema00100.wav (일반)
				: ema00101.wav ~ ema00200.wav (기쁨)
				: ema00201.wav ~ ema00300.wav (슬픔)
				: ema00301.wav ~ ema00400.wav (화남)
			script/ - 감정연구용 A화자 녹음 대본(UTF-8)
				: ema00001.txt ~ ema00100.txt (일반)
				: ema00101.txt ~ ema00200.txt (기쁨)
				: ema00201.txt ~ ema00300.txt (슬픔)
				: ema00301.txt ~ ema00400.txt (화남)
			transcript/ - 감정연구용 A화자 녹음 대본 철자전사(UTF-8)
				: ema00001.txt ~ ema00100.txt (일반)
				: ema00101.txt ~ ema00200.txt (기쁨)
				: ema00201.txt ~ ema00300.txt (슬픔)
				: ema00301.txt ~ ema00400.txt (화남)

		emb/ - 감정연구용 B화자(여성) 디렉토리 
			wav/ - 감정연구용 B화자 음성 데이터
				: emb00001.wav ~ emb00100.wav (일반)
				: emb00101.wav ~ emb00200.wav (기쁨)
				: emb00201.wav ~ emb00300.wav (슬픔)
				: emb00301.wav ~ emb00400.wav (화남)
			script/ - 감정연구용 B화자 녹음 대본(UTF-8)
				: emb00001.txt ~ emb00100.txt (일반)
				: emb00101.txt ~ emb00200.txt (기쁨)
				: emb00201.txt ~ emb00300.txt (슬픔)
				: emb00301.txt ~ emb00400.txt (화남)
			transcript/ - 감정연구용 B화자 녹음 대본 철자전사(UTF-8)
				: emb00001.txt ~ emb00100.txt (일반)
				: emb00101.txt ~ emb00200.txt (기쁨)
				: emb00201.txt ~ emb00300.txt (슬픔)
				: emb00301.txt ~ emb00400.txt (화남)

		emf/ - 감정연구용 F화자(남성) 디렉토리 
			wav/ - 감정연구용 F화자 음성 데이터
				: emf00001.wav ~ emf00100.wav (일반)
				: emf00101.wav ~ emf00200.wav (기쁨)
				: emf00201.wav ~ emf00300.wav (슬픔)
				: emf00301.wav ~ emf00400.wav (화남)
			script/ - 감정연구용 F화자 녹음 대본(UTF-8)
				: emf00001.txt ~ emf00100.txt (일반)
				: emf00101.txt ~ emf00200.txt (기쁨)
				: emf00201.txt ~ emf00300.txt (슬픔)
				: emf00301.txt ~ emf00400.txt (화남)
			transcript/ - 감정연구용 F화자 녹음 대본 철자전사(UTF-8)
				: emf00001.txt ~ emf00100.txt (일반)
				: emf00101.txt ~ emf00200.txt (기쁨)
				: emf00201.txt ~ emf00300.txt (슬픔)
				: emf00301.txt ~ emf00400.txt (화남)

		emg/ - 감정연구용 G화자(남성) 디렉토리 
			wav/ - 감정연구용 G화자 음성 데이터
				: emg00001.wav ~ emg00100.wav (일반)
				: emg00101.wav ~ emg00200.wav (기쁨)
				: emg00201.wav ~ emg00300.wav (슬픔)
				: emg00301.wav ~ emg00400.wav (화남)
			script/ - 감정연구용 G화자 녹음 대본(UTF-8)
				: emg00001.txt ~ emg00100.txt (일반)
				: emg00101.txt ~ emg00200.txt (기쁨)
				: emg00201.txt ~ emg00300.txt (슬픔)
				: emg00301.txt ~ emg00400.txt (화남)
			transcript/ - 감정연구용 G화자 녹음 대본 철자전사(UTF-8)
				: emg00001.txt ~ emg00100.txt (일반)
				: emg00101.txt ~ emg00200.txt (기쁨)
				: emg00201.txt ~ emg00300.txt (슬픔)
				: emg00301.txt ~ emg00400.txt (화남)

		emh/ - 감정연구용 H화자(남성) 디렉토리 
			wav/ - 감정연구용 H화자 음성 데이터
				: emh00001.wav ~ emh00100.wav (일반)
				: emh00101.wav ~ emh00200.wav (기쁨)
				: emh00201.wav ~ emh00300.wav (슬픔)
				: emh00301.wav ~ emh00400.wav (화남)
			script/ - 감정연구용 H화자 녹음 대본(UTF-8)
				: emh00001.txt ~ emh00100.txt (일반)
				: emh00101.txt ~ emh00200.txt (기쁨)
				: emh00201.txt ~ emh00300.txt (슬픔)
				: emh00301.txt ~ emh00400.txt (화남)
			transcript/ - 감정연구용 H화자 녹음 대본 철자전사(UTF-8)
				: emh00001.txt ~ emh00100.txt (일반)
				: emh00101.txt ~ emh00200.txt (기쁨)
				: emh00201.txt ~ emh00300.txt (슬픔)
				: emh00301.txt ~ emh00400.txt (화남)


	5) emotional-to-emotional : 감정 표현 기술 연구를 위한 연구용 DB (감정 대본)
		nea/ - 감정연구용 A화자(여성) 디렉토리 
			wav/ - 감정연구용 A화자 음성 데이터
				: nea00001.wav ~ nea00100.wav (일반)
				: nea00101.wav ~ nea00200.wav (기쁨)
				: nea00201.wav ~ nea00300.wav (슬픔)
				: nea00301.wav ~ nea00400.wav (화남)
			script/ - 감정연구용 A화자 녹음 대본(UTF-8)
				: nea00001.txt ~ nea00100.txt (일반)
				: nea00101.txt ~ nea00200.txt (기쁨)
				: nea00201.txt ~ nea00300.txt (슬픔)
				: nea00301.txt ~ nea00400.txt (화남)
			transcript/ - 감정연구용 A화자 녹음 대본 철자전사(UTF-8)
				: nea00001.txt ~ nea00100.txt (일반)
				: nea00101.txt ~ nea00200.txt (기쁨)
				: nea00201.txt ~ nea00300.txt (슬픔)
				: nea00301.txt ~ nea00400.txt (화남)

		neb/ - 감정연구용 B화자(여성) 디렉토리 
			wav/ - 감정연구용 B화자 음성 데이터
				: neb00001.wav ~ neb00100.wav (일반)
				: neb00101.wav ~ neb00200.wav (기쁨)
				: neb00201.wav ~ neb00300.wav (슬픔)
				: neb00301.wav ~ neb00400.wav (화남)
			script/ - 감정연구용 B화자 녹음 대본(UTF-8)
				: neb00001.txt ~ neb00100.txt (일반)
				: neb00101.txt ~ neb00200.txt (기쁨)
				: neb00201.txt ~ neb00300.txt (슬픔)
				: neb00301.txt ~ neb00400.txt (화남)
			transcript/ - 감정연구용 B화자 녹음 대본 철자전사(UTF-8)
				: neb00001.txt ~ neb00100.txt (일반)
				: neb00101.txt ~ neb00200.txt (기쁨)
				: neb00201.txt ~ neb00300.txt (슬픔)
				: neb00301.txt ~ neb00400.txt (화남)

		nec/ - 감정연구용 C화자(여성) 디렉토리 
			wav/ - 감정연구용 C화자 음성 데이터
				: nec00001.wav ~ nec00100.wav (일반)
				: nec00101.wav ~ nec00200.wav (기쁨)
				: nec00201.wav ~ nec00300.wav (슬픔)
				: nec00301.wav ~ nec00400.wav (화남)
			script/ - 감정연구용 C화자 녹음 대본(UTF-8)
				: nec00001.txt ~ nec00100.txt (일반)
				: nec00101.txt ~ nec00200.txt (기쁨)
				: nec00201.txt ~ nec00300.txt (슬픔)
				: nec00301.txt ~ nec00400.txt (화남)
			transcript/ - 감정연구용 C화자 녹음 대본 철자전사(UTF-8)
				: nec00001.txt ~ nec00100.txt (일반)
				: nec00101.txt ~ nec00200.txt (기쁨)
				: nec00201.txt ~ nec00300.txt (슬픔)
				: nec00301.txt ~ nec00400.txt (화남)

		ned/ - 감정연구용 D화자(여성) 디렉토리 
			wav/ - 감정연구용 D화자 음성 데이터
				: ned00001.wav ~ ned00100.wav (일반)
				: ned00101.wav ~ ned00200.wav (기쁨)
				: ned00201.wav ~ ned00300.wav (슬픔)
				: ned00301.wav ~ ned00400.wav (화남)
			script/ - 감정연구용 D화자 녹음 대본(UTF-8)
				: ned00001.txt ~ ned00100.txt (일반)
				: ned00101.txt ~ ned00200.txt (기쁨)
				: ned00201.txt ~ ned00300.txt (슬픔)
				: ned00301.txt ~ ned00400.txt (화남)
			transcript/ - 감정연구용 D화자 녹음 대본 철자전사(UTF-8)
				: ned00001.txt ~ ned00100.txt (일반)
				: ned00101.txt ~ ned00200.txt (기쁨)
				: ned00201.txt ~ ned00300.txt (슬픔)
				: ned00301.txt ~ ned00400.txt (화남)

		nee/ - 감정연구용 E화자(여성) 디렉토리 
			wav/ - 감정연구용 E화자 음성 데이터
				: nee00001.wav ~ nee00100.wav (일반)
				: nee00101.wav ~ nee00200.wav (기쁨)
				: nee00201.wav ~ nee00300.wav (슬픔)
				: nee00301.wav ~ nee00400.wav (화남)
			script/ - 감정연구용 E화자 녹음 대본(UTF-8)
				: nee00001.txt ~ nee00100.txt (일반)
				: nee00101.txt ~ nee00200.txt (기쁨)
				: nee00201.txt ~ nee00300.txt (슬픔)
				: nee00301.txt ~ nee00400.txt (화남)
			transcript/ - 감정연구용 E화자 녹음 대본 철자전사(UTF-8)
				: nee00001.txt ~ nee00100.txt (일반)
				: nee00101.txt ~ nee00200.txt (기쁨)
				: nee00201.txt ~ nee00300.txt (슬픔)
				: nee00301.txt ~ nee00400.txt (화남)

		nek/ - 감정연구용 K화자(남성) 디렉토리 
			wav/ - 감정연구용 K화자 음성 데이터
				: nek00001.wav ~ nek00100.wav (일반)
				: nek00101.wav ~ nek00200.wav (기쁨)
				: nek00201.wav ~ nek00300.wav (슬픔)
				: nek00301.wav ~ nek00400.wav (화남)
			script/ - 감정연구용 K화자 녹음 대본(UTF-8)
				: nek00001.txt ~ nek00100.txt (일반)
				: nek00101.txt ~ nek00200.txt (기쁨)
				: nek00201.txt ~ nek00300.txt (슬픔)
				: nek00301.txt ~ nek00400.txt (화남)
			transcript/ - 감정연구용 K화자 녹음 대본 철자전사(UTF-8)
				: nek00001.txt ~ nek00100.txt (일반)
				: nek00101.txt ~ nek00200.txt (기쁨)
				: nek00201.txt ~ nek00300.txt (슬픔)
				: nek00301.txt ~ nek00400.txt (화남)

		nel/ - 감정연구용 L화자(남성) 디렉토리 
			wav/ - 감정연구용 L화자 음성 데이터
				: nel00001.wav ~ nel00100.wav (일반)
				: nel00101.wav ~ nel00200.wav (기쁨)
				: nel00201.wav ~ nel00300.wav (슬픔)
				: nel00301.wav ~ nel00400.wav (화남)
			script/ - 감정연구용 L화자 녹음 대본(UTF-8)
				: nel00001.txt ~ nel00100.txt (일반)
				: nel00101.txt ~ nel00200.txt (기쁨)
				: nel00201.txt ~ nel00300.txt (슬픔)
				: nel00301.txt ~ nel00400.txt (화남)
			transcript/ - 감정연구용 L화자 녹음 대본 철자전사(UTF-8)
				: nel00001.txt ~ nel00100.txt (일반)
				: nel00101.txt ~ nel00200.txt (기쁨)
				: nel00201.txt ~ nel00300.txt (슬픔)
				: nel00301.txt ~ nel00400.txt (화남)

		nem/ - 감정연구용 M화자(남성) 디렉토리 
			wav/ - 감정연구용 M화자 음성 데이터
				: nem00001.wav ~ nem00100.wav (일반)
				: nem00101.wav ~ nem00200.wav (기쁨)
				: nem00201.wav ~ nem00300.wav (슬픔)
				: nem00301.wav ~ nem00400.wav (화남)
			script/ - 감정연구용 M화자 녹음 대본(UTF-8)
				: nem00001.txt ~ nem00100.txt (일반)
				: nem00101.txt ~ nem00200.txt (기쁨)
				: nem00201.txt ~ nem00300.txt (슬픔)
				: nem00301.txt ~ nem00400.txt (화남)
			transcript/ - 감정연구용 M화자 녹음 대본 철자전사(UTF-8)
				: nem00001.txt ~ nem00100.txt (일반)
				: nem00101.txt ~ nem00200.txt (기쁨)
				: nem00201.txt ~ nem00300.txt (슬픔)
				: nem00301.txt ~ nem00400.txt (화남)

		nen/ - 감정연구용 N화자(남성) 디렉토리 
			wav/ - 감정연구용 N화자 음성 데이터
				: nen00001.wav ~ nen00100.wav (일반)
				: nen00101.wav ~ nen00200.wav (기쁨)
				: nen00201.wav ~ nen00300.wav (슬픔)
				: nen00301.wav ~ nen00400.wav (화남)
			script/ - 감정연구용 N화자 녹음 대본(UTF-8)
				: nen00001.txt ~ nen00100.txt (일반)
				: nen00101.txt ~ nen00200.txt (기쁨)
				: nen00201.txt ~ nen00300.txt (슬픔)
				: nen00301.txt ~ nen00400.txt (화남)
			transcript/ - 감정연구용 N화자 녹음 대본 철자전사(UTF-8)
				: nen00001.txt ~ nen00100.txt (일반)
				: nen00101.txt ~ nen00200.txt (기쁨)
				: nen00201.txt ~ nen00300.txt (슬픔)
				: nen00301.txt ~ nen00400.txt (화남)

		neo/ - 감정연구용 O화자(남성) 디렉토리 
			wav/ - 감정연구용 O화자 음성 데이터
				: neo00001.wav ~ neo00100.wav (일반)
				: neo00101.wav ~ neo00200.wav (기쁨)
				: neo00201.wav ~ neo00300.wav (슬픔)
				: neo00301.wav ~ neo00400.wav (화남)
			script/ - 감정연구용 O화자 녹음 대본(UTF-8)
				: neo00001.txt ~ neo00100.txt (일반)
				: neo00101.txt ~ neo00200.txt (기쁨)
				: neo00201.txt ~ neo00300.txt (슬픔)
				: neo00301.txt ~ neo00400.txt (화남)
			transcript/ - 감정연구용 O화자 녹음 대본 철자전사(UTF-8)
				: neo00001.txt ~ neo00100.txt (일반)
				: neo00101.txt ~ neo00200.txt (기쁨)
				: neo00201.txt ~ neo00300.txt (슬픔)
				: neo00301.txt ~ neo00400.txt (화남)

Contact

서울시 금천구 가산디지털1로 19, 19~20층 (주)셀바스에이아이 TTS_Support@selvas.com

LICENSE

Cc-by-nc-nd