Python3实现豆瓣电影TOP250抓取,然后对爬取的数据进行分析。
使用的库:
- requests
- BeautifulSoup
- csv
- pandas
- matplotlab
爬取数据生成的csv文件在Windows中用Excel打开是乱码,因为用的是UTF-8格式进行编码,想要正常显示就在movies_spider.py文件中把 open() 里面的格式改为gb18030。
具体分析可以看个人博客:https://blog.csdn.net/weixin_44613063/article/details/87646619