/1st-PyCrawlerMarathon

An Online Flipped Classroom relating to web crawler. In the final project, I use tkinter to implement a web crawler GUI program

Primary LanguageJupyter Notebook

Overview

該專案的內容與「網路爬蟲」有關。以下的程式碼是一堂線上課程的作業,這些作業能使人循序漸進地了解網路爬蟲的實作技巧。在該門課的期末專題裡,我以Tkinter寫了一個GUI,該GUI能爬取Cupoy的新聞並做一些資料分析。若想知道更多內容,可向下瀏覽,或是點擊右方連結 官方網站連結 查看

Course Content

Part01:爬蟲基礎知識

Part02:靜態網頁爬蟲技術

Part03:動態網頁爬蟲技術

Part04:Scrapy網站爬蟲框架

Part05:進階爬蟲技術

期末專題 : Cupoy新聞爬蟲暨資料分析

摘要 :

利用 Python 爬取 Cupoy 上的新聞資訊,爾後再對新聞進行相關分析。最後成果為一圖形使用者介面,該介面可爬取並印出Cupoy的新聞種類、標題、簡介和網址。更進一步,能對這些資料進行分析,進而能繪出圓餅圖、文字雲,分析文章的正面情緒機率等等

安裝方法 :

該程式由本人撰寫,有興趣者可自由下載,以下提供安裝方法。首先,需把程式內使用到的套件安裝起來。在 Anaconda Prompt 輸入下列命令即可

$ pip install selenium 
$ pip install BeautifulSoup    
$ pip install jieba    
$ pip install snownlp        
$ pip install wordcloud    

之後,從該載點 程式載點 ,下載 chromedriver.exestopWords.txtCupoy Web Crawler.py 三個檔案,並將這三個檔案放進相同的路徑。最後,使用 Anaconda Prompt 移動至該路徑,再以「python Cupoy Web Crawler.py」執行程式,便能開啟 GUI,介面如下圖所示

# Anaconda Prompt 指令
$ cd folder
$ python Cupoy Web Crawler.py

介面 :

補充說明 :

若想知道更多關於本專案的內容,請點擊右方連結 Cupoy新聞爬蟲暨資料分析 查看。若喜歡本專題,該篇文章及程式碼有幫助到你的話,請不吝順手點個Star哦