/feitsui

翡翠粤语歌词网歌词下载

Primary LanguagePythonMIT LicenseMIT

Feitsui Downloader

翡翠粤语歌词 (https://www.feitsui.com) 下载器,从翡翠粤语歌词网站下载粤语歌词,存储到MongoDB,并将歌词做成docx和pdf格式(方便有打印需求的人打印)。Just for fun :)

原网站歌词

下载制作PDF后效果

0. 依赖

  • MongoDB数据库,pymongo
  • python-docx
  • BeautifulSoup
  • requests
  • win32com

1. 歌词下载

依次运行code/spider.py脚本中注释的3部分,分别爬取全部歌手信息每位歌手的歌单信息每首歌的歌词,存入MongoDB。MongoDB中只有两个Collection,分别是singerslyric,分别存储歌手信息和歌词信息,如下图。

歌手

singers.png

歌词

song.png

2. 生成docx然后转换pdf

  1. 运行code/gen_doc.py生成docx格式的歌词文件,存储在lyrics目录下。
  2. 运行code/docx2pdf.pydocx格式的文件转换成pdf格式的文件,存储在pdf目录下。

3. 结果

  • 最后收集到6593首粤语歌词(带有粤拼)。
  • feitsui_dump目录下是已经爬取好并导出的MongoDB文件,为避免再次下载,可通过mongorestore -d feitsui feitsui_dump/feitsui直接导入到MongoDB中使用。

count.png

4. 其它

原网站歌词制作者制作歌词不易,歌词请勿滥用及个人获利。如有侵权,请联系删除。yqqbeyond at gmail.com