Programmer-Study-English

功能

从远程爬取数据并分析成词频表.即data目录指定目录下counter.json

分析本地纯文件文件,分析生成词频表.

提供

这里的例句算得上全是权威例句了. 而这个功能是一个不一样的功能. 它提供在线服务的可能.

DataBaseSystem: 需要增加一个内容: 遍历:获取文件路径和其他信息.

什么是更好的需求呢?

基于状态的回调处理我们现在的爬虫还比较原始. 回调方面希望能够升级成: 基于状态转换的回调 eg: a种情况使用 b回调,c种情况,使用d回调. 注册回调函数.

s-a->b-c->d 这样就能兼容多种页面的需求了.现在有些页面:

就会出现这样的情况,现在是两级处理:1回调获取地址2回调获取页面信息. 但是会遇到情况: 获取页面信息中又会获得地址之类的...