Overview

該專案的內容與「網路爬蟲」有關。以下的程式碼是一堂線上課程的作業，這些作業能使人循序漸進地了解網路爬蟲的實作技巧。在該門課的期末專題裡，我以Tkinter寫了一個GUI，該GUI能爬取Cupoy的新聞並做一些資料分析。若想知道更多內容，可向下瀏覽，或是點擊右方連結官方網站連結查看

Course Content

Part01：爬蟲基礎知識

Part02：靜態網頁爬蟲技術

Part03：動態網頁爬蟲技術

Part04：Scrapy網站爬蟲框架

Part05：進階爬蟲技術

期末專題 : Cupoy新聞爬蟲暨資料分析

摘要 :

利用 Python 爬取 Cupoy 上的新聞資訊，爾後再對新聞進行相關分析。最後成果為一圖形使用者介面，該介面可爬取並印出Cupoy的新聞種類、標題、簡介和網址。更進一步，能對這些資料進行分析，進而能繪出圓餅圖、文字雲，分析文章的正面情緒機率等等

安裝方法 :

該程式由本人撰寫，有興趣者可自由下載，以下提供安裝方法。首先，需把程式內使用到的套件安裝起來。在 Anaconda Prompt 輸入下列命令即可

$ pip install selenium 
$ pip install BeautifulSoup    
$ pip install jieba    
$ pip install snownlp        
$ pip install wordcloud

之後，從該載點程式載點，下載 chromedriver.exe、stopWords.txt、Cupoy Web Crawler.py 三個檔案，並將這三個檔案放進相同的路徑。最後，使用 Anaconda Prompt 移動至該路徑，再以「python Cupoy Web Crawler.py」執行程式，便能開啟 GUI，介面如下圖所示

# Anaconda Prompt 指令
$ cd folder
$ python Cupoy Web Crawler.py

介面 :

補充說明 :

若想知道更多關於本專案的內容，請點擊右方連結 Cupoy新聞爬蟲暨資料分析查看。若喜歡本專題，該篇文章及程式碼有幫助到你的話，請不吝順手點個Star哦

Ether-YiTseWu/1st-PyCrawlerMarathon