/WebSpider

用 nodejs 寫成的爬蟲服務

Primary LanguageJavaScript

輕輕鬆鬆用 Node.js 寫網路爬蟲

目錄底下有兩個專案 , 介紹如下

Spider

Introduce

  • 用 nodejs 寫出一個爬蟲 , 幫我們查尋機票價錢
  • 目標: 香草航空訂票頁面
  • 小技巧 :用 chrome 開發工具研究瀏覽器與 server 的 http request &response , 以及用 postman 測試 http request

Dependencies

Third-party
Cheerio : 與 jQuery 相似 , 提供 DOM 操作方法 , 方便我們解析抓到的頁面

Built in
Https : 使用 https.request 像 server 發出請求取得頁面
Querystring :使用 querystring.stringify 將我們的表單資料 json 包裝成 server可解讀的形式
File System : 使用 fs.writeFile 將 server 端回傳的頁面存在本地

Basic Install

cd spider
npm install

Run

node demo.js



Site

alt tag

因為計畫去日本旅遊 , 但去每一個網站查詢票價太麻煩了 , 所以把高雄到日本廉航網站都爬了一遍 , 然後做出了這個票價查詢網站

Introduce

Basic Install

cd site
npm install
bower install

Run

npm start

Go to http://localhost:3030/ , Enjoy !!

Other

如果想一起讓這個專案更強大或者發現任何問題 , 歡迎 pull request 或者聯繫我