snatch
一个根据链接地址抓取标题数据,内容和图片并响应的示例
支持http和https
#使用方法 这里 我已将其抽取为一个公共restful,可直接调用获取
http://snatch.chqiangs.com/getSnatchContent?url=要抓取的地址
#示例代码 angular代码示例
var originUrl = "http://snatch.chqiangs.com";
var reg = "http://www.baidu.com";//要抓取的地址
$http.get(originUrl+"/getSnatchContent?url="+reg).success(function(data){
var html = $(data.content);//body中的内容
scope.title = data.title;//链接的标题
var imgs = [];
//以下是获取图片和主要内容的处理
for(var i in html){
if(html[i].nodeName=="DIV"){
scope.conHtml = $(html[i].innerHTML);
//content:主要内容
scope.content = scope.conHtml.find("p").text().replace(/\s/g,"").substring(0,49)+"...";
scope.conHtml.find("img").each(function(){
if($(this).attr("src")||$(this).attr("data-src")){
imgs.push($(this).attr("src")||$(this).attr("data-src"));
}
});
//img:第一张图片
scope.img = imgs[0];
break;
}
}
})