/snatch

一个根据链接地址抓取标题数据,内容和图片并响应的示例

Primary LanguageJavaScript

snatch

一个根据链接地址抓取标题数据,内容和图片并响应的示例

支持http和https

#使用方法 这里 我已将其抽取为一个公共restful,可直接调用获取

  http://snatch.chqiangs.com/getSnatchContent?url=要抓取的地址

#示例代码 angular代码示例

  var originUrl = "http://snatch.chqiangs.com";
  var reg = "http://www.baidu.com";//要抓取的地址
  $http.get(originUrl+"/getSnatchContent?url="+reg).success(function(data){
      var html = $(data.content);//body中的内容
      scope.title = data.title;//链接的标题
      var imgs = [];
      //以下是获取图片和主要内容的处理
      for(var i in html){
        if(html[i].nodeName=="DIV"){
          scope.conHtml = $(html[i].innerHTML);
          //content:主要内容
          scope.content = scope.conHtml.find("p").text().replace(/\s/g,"").substring(0,49)+"...";

          scope.conHtml.find("img").each(function(){
            if($(this).attr("src")||$(this).attr("data-src")){
              imgs.push($(this).attr("src")||$(this).attr("data-src"));
            }
          });
          //img:第一张图片
          scope.img = imgs[0];
          break;
        }
      }
    })