/IPOStatus

首次公开发行股票申请企业情况的数据爬取,pyecharts和表格生成

Primary LanguagePython

IPOStatus

首次公开发行股票申请企业情况的数据爬取,pyecharts和表格生成(一)

首次公开发行股票申请企业情况的数据爬取,pyecharts和表格生成(二)

首次公开发行股票申请企业情况的数据爬取,pyecharts和表格生成(三)

首次公开发行股票申请企业情况的数据爬取,pyecharts和表格生成(四)

效果页面

先发一个最终效果图的网址:https://www.cnvar.cn/ipostatus/

后期版本(参考,代码相差不大):https://cnf10.com/

起因

最近我的同事跟我讨论起在某微信公众号看到的IPO发行情况,他说他比较好奇这些数据的来源出处。于是乎,我就把整个证监会网站都找了一遍,最终找到了一个并不起眼的网页:[【行政许可事项】发行监管部首次公开发行股票审核工作流程及申请企业情况 ][1] ,一番研究之后确定这个网页就是每周IPO发行情况的数据出处。本来这事应该就此结束,但鉴于这些用excel展示的数据并不直观,于是乎我就打算将其图像化。

步骤

页面数据和excel文件的爬取 -> 读取excel文件并将其合并统计-> 将此表格转为markdown形式(方便放在HEXO上显示)

目录结构

+--main.py
+--processing
|      +--data
|      |      +--graph.html
|      |      +--index.md
|      |      +--IPOstatus
|      |      |      +--data
|      |      |      |      +--20180727.xls
|      |      |      |      +--20180803.xls
|      |      |      |      +--20180810.xls
|      |      |      |      +--20180817.xls
|      |      |      |      +--20180824.xls
|      |      |      +--md
|      |      |      |      +--20180727.md
|      |      |      |      +--20180803.md
|      |      |      |      +--20180810.md
|      |      |      |      +--20180817.md
|      |      |      |      +--20180824.md
|      |      |      +--stat.csv
|      |      |      +--termination
|      |      |      |      +--20180803.xls
|      |      |      |      +--20180810.xls
|      |      |      |      +--20180817.xls
|      |      |      |      +--20180824.xls
|      +--datatomd.py
|      +--data_crawler.py
|      +--generator.py
|      +--__init__.py