CSDN博客迁移至Hexo,同步CSDN博文到本地MD文件。
功能:
- 利用爬虫爬取指定用户的CSDN博客文章
- 把爬取到的html文章内容转化为符合Hexo风格的markdown文件
通过这个项目得到了所有markdown文件,可以让我们很轻松的把文章同步到Hexo博客中,完成博客的迁移!
技术关键词:Java,网络爬虫
主要技术 | 工具 |
---|---|
爬虫 | Httpclient,Jsoup |
Html转markdown | html2markdown |
效果
文件夹结构之html目录 存放从CSDN博客爬下来的HTML格式文章