/midi_lyric_corpus

一个包含250首中文歌的 midi 文件,以及相对应歌词文本的语料库。

Primary LanguageShell

Midi-lyric parallel corpus

这个语料库包括了250首中文歌的midi 文件,还有相应的歌词。

This is a corpus has midi files about 250 Chinese songs and corresponding lyrics.

可以用这个语料库进行很多事情,比如简单的用 seq2seq 来训练作词的模型。

We can use this corpus do a lot of things, such as train a simple seq2seq lyric writing model according to the melody of a song.

To-do

  • 写脚本,将数据中的文本数据进行转码
  • 想些比较有意思的项目