Excel虽然可以非常方便地处理数据,但数据量大时速度就变慢了,本项目把Excel数据分析的常用功能:筛选、多表合并、多表汇总、多表分组,通过Python+Pandas重新实现,因为Pandas处理数据更快且能处理大的数据,此工具还可根据业务需求灵活修改少量代码实现通用。
-pandas==0.25.1 -matplotlib==2.2.2 -glob2==0.6 另外还需安装pyqt5
下载excel_analysis项目到本地,PyCharm导入项目并配好运行环境以及安装上述依赖包,运行Main.py,出现如下界面:
1.导入要处理的数据文件夹
导入后左侧文件列表出现文件夹里的文件名
2.筛选保存:选择要筛选的表,这里筛选的列是代码写好的,可根据业务改变,这里筛选指定列,即指定显示的列,其余列统统丢掉
筛选前
筛选后