/Demo_TouTiao_Python

获取来源,今日头条为数据来源:https://www.toutiao.com/ ,抓取内容搜索时间为 2019年12月25。数据处理,然后先初步看下这样抓取下来的新闻内容是什么,条数是多少。词频统计,对这些新闻内容进行分词,然后词频统计。

Primary LanguagePython

1、Python语言的应用 之 爬取今日头条数据并进行词频统计

1.1、获取来源

今日头条为数据来源:https://www.toutiao.com/

1.2、抓取内容

搜索表达式 时间为 2019年12月25

1.3、数据处理

然后先初步看下这样抓取下来的新闻内容是什么,条数是多少

1.4、词频统计

对这些新闻内容进行分词,然后词频统计。

2、更新信息

开发者:沙振宇(沙师弟专栏)
创建时间:2018-12-24
最后一次更新时间:2019-12-27
https://shazhenyu.blog.csdn.net

3、效果图

image image image