Mindzy/pyreports_crawler

PythonMIT

pyreports_crawler

版本

v0.2

运行环境

Python 2.7

功能

从研报和年报获取正文
利用TextRank算法从研报中提取带有权重的关键词
用研报关键词提取年报关键句子并标权重

改进空间

其他需求

~~从年报里提取关键词~~
- TextRank权重
- 词频
~~优先提取“董事会报告”或“经营情况讨论分析”~~

Version

v0.2

Requirements

Python 2.7

Feature

Extract context from analytic reports and annual reports.
Use TextRank to extract keywords with weight from analytic reports.
Use keywords from analytic reports to extract context in annual reports.

Room for improvement

Other Requests

~~Extract keywords from annaul report~~
- TextRank weight
- ~~Word count~~
~~Extract 'Directors' Report' or 'Business Conditions Analysis' first.~~