telunyang/nodejs_web_scraping

Node.js 深度網路爬蟲

JavaScript

Node.js 網路爬蟲

使用 cURL 來取得動態、靜態的網頁資訊。
使用 nightmare.js 來取得動態網頁元素生成的頁面資訊。
使用 Selenium Dev 來取得動態網頁元素生成的頁面資訊。

用途

為 node.js 開發者建立的深度爬蟲操作範例
爬取結果轉換成 JSON，可以進行資料交換

範例操作環境

Windows 10
Google Meet
Visual Studio Code
nvm（Windows版本）
node.js v12.15.0
npm v6.13.4

建議使用套件列表

nightmare
jquery
jsdom
moment
selenium-webdriver

$ npm i nightmare jquery jsdom moment selenium-webdriver --save

若是你已經取得本專案，尤其專題資料夾裡面有 package.json，請直接使用：

$ npm i --save

範例影片