andy-yangz/midi_lyric_corpus

一个包含250首中文歌的 midi 文件，以及相对应歌词文本的语料库。

Shell

Midi-lyric parallel corpus

这个语料库包括了250首中文歌的midi 文件，还有相应的歌词。

This is a corpus has midi files about 250 Chinese songs and corresponding lyrics.

可以用这个语料库进行很多事情，比如简单的用 seq2seq 来训练作词的模型。

We can use this corpus do a lot of things, such as train a simple seq2seq lyric writing model according to the melody of a song.

To-do

写脚本，将数据中的文本数据进行转码
想些比较有意思的项目