/crawler

爬虫 获取一个站点的指定内容

Primary LanguageJavaScriptApache License 2.0Apache-2.0

crawler

爬虫 获取一个站点的指定内容

运行

node app

操作步骤

第一步:输入正确的入口 URL

第二步:输入过滤页面中 URL 的正则表达式

第三步:输入要匹配的内容正则表达式

说明

包含指定内容的 url 将会写入到 links.txt 文件里