RSS2SNB 用于将RSS转换为Bambook SNB自有格式的小工具。其实是做给程序员的一个小玩具:-) 可跨平台运行于Windows与Linux之上。基于JRuby开发。 遵循Apache License, Version 2.0。 源代码地址: https://github.com/digitalsonic/rss2snb DigitalSonic 安装指南 =========================================== 1. 安装JRuby 到 http://jruby.org/download 下载最新JRuby包,事先请安装JDK(版本>=1.5,建议使用1.6以上版本)。 如果是Windows,也可选择自带Java的exe安装包。 如果是Ubuntu,请自行选择apt方式或下载tar.gz包。 Windows中,打开“开始”菜单,点击“运行”,键入“CMD”,点击“确认”。 在弹出的命令行中输入:jruby --version 回车后如果显示JRuby版本则说明安装成功。 Ubuntu中,在终端中运行 jruby --version 2.安装gem 假设rss2snb.zip解压缩到了D盘rss2snb目录中,打开CMD命令行,运行: d: <回车> cd d:\rss2snb <回车> jruby -S gem install rss2snb-1.0.gem --no-ri --no-rdoc 随后会自动进行安装,如果事先安装过想卸载,运行: jruby -S gem uninstall rss2snb Ubuntu中,请在解压缩的目录中自行运行上面的两条jruby命令 3.执行生成snb文件 首先修改config.yml配置生成文件路径等内容,各配置说明见文件内描述(一次性配置,一般情况下可跳过此步)。 然后在channels.yml中配置需要抓取的RSS内容。 最后在rss2snb\bin目录中,运行: run <回车> Ubuntu中,运行run.sh 注意: Ubuntu中运行时,可能会报几个so文件依赖不到,例如libxml2.so、libxslt.so和libexslt.so。 这些库其实是有的,在/usr/lib中可以找到几个同文件主名的文件,请自行按报错提示的so文件重行做下ln。 这个错是JRuby通过FFI来调用Nokogiri时报的,与程序本身没什么关系。 ChangeLog =========================================== v1.0 发布时间:2011-02-19 修正myNoSQL网站结构变化带来的插件问题。 在插件无法正确解析的情况下,直接取RSS的Description作为正文内容。 v0.9 发布时间:2011-02-10 调整部分程序日志输出、说明等内容。 v0.8 发布时间:2011-01-20 调整下载图片的横向分辨率为500,修正无法上传时依旧显示上传成功的BUG。 v0.7 发布时间:2011-01-18 增加SpringSource Team Blog( http://blog.springsource.com )和NoSQLfan( http://blog.nosqlfan.com )全文抓取支持。 支持JRuby 1.6.0.RC1。 可配置跳过某些RSS,方便临时去除一些订阅项。 默认提供了一些程序员关注的网站RSS配置,有些需要代理访问的站点默认被跳过。 v0.6.1 发布时间:2011-01-04 修正一个与HTTP::Found相关的缺陷,该缺陷导致Feedsky读取不正常。 v0.6 发布时间:2011-01-02 除png、jpg之外,支持更多图片类型,自动将所有图片转换为jpg格式。 v0.5 发布时间:2010-12-27 增加myNoSQL( http://nosql.mypopescu.com/ )和Scalable Web Architectures( http://www.royans.net/arch/ )全文抓取支持。 分离配置文件,独立RSS Channel至channels.yml中。明确区分需要用户配置的项。 默认使用JRuby的1.9模式运行。(1.9的库支持ATOM了) v0.4 发布时间:2010-12-18 支持自定义全文抓取插件,提供InfoQ( http://www.infoq.com )和 High Scalability( http://highscalability.com )的支持。 v0.3 发布时间:2010-12-14 支持代理服务器(有些RSS直接访问不到,原因你懂的) 支持自动上传 根据操作系统判断配置文件中图书信息(book段)的字符集,Windows为GBK,Ubuntu为UTF-8 v0.2 发布时间:2010-12-03 支持图片多线程下载,图片优化 v0.1 发布时间:2010-11-26 初始版本,使用JRuby开发,可运行于WinXP及Ubuntu,其他系统未做测试 支持从配置文件(例如config.yml)中读取配置,多线程读取RSS,生成SNB