/WeChat-Relay-Statistics

将接龙的内容转换为excel表格

Primary LanguagePythonCreative Commons Zero v1.0 UniversalCC0-1.0

title author date output
WeChat Relay Statistics
tianqo
2024-08-08
pdf_document
latex_engine mainfont
xeHarmoHarmo
Harmony SC sans

WeChat Relay Statistics

微信接龙统计程序

微信接龙永远只是一个接龙...没错..一个txt文档

而这个程序则可以将这个该死的txt文档转换为excel文档

示例如下:

image

这是微信里的接龙 (时间紧任务重 直接偷班级群)

image

而这则是该程序处理后的效果👍👍

真爽

以及...

参加人数为:13人
反之人数为:7人
其中有1人数据有问题,请自行检查。

是的,针对参加与不参加这样1与0的统计,我开发了b程序,该程序可以统计出参与与不参加的人数以及错误人数自我检测。


程序说明(必看!):

对于统计这一词的问题,我也有做过了解,目前的程序的确只是实现了归类管理的功能,可能有人会认为这是一个分类程序,并且其他程序更加完善并且操作丰富。而实际上归类管理也是属于统计的一部分,程序并没有跑题,而且市面上更没有所谓的更加完美的能实现我目前的分类程序。

综上,该程序是独一无二并且完美符合要求的统计程序,而那些人理解的统计事实上才是已经拥有的程序(统计次数、出现频率、总计等),所以本程序强调的是杂乱项的统计管理,而不是对次数的统计计数,这需要搞清楚。

所以说这个程序的真正操作是对文本内容进行分类合并,再使用excel或者only office等程序对文件进行进一步统计

对于实在无法理解统计一词的人我也实在没办法,只好继续开发二次统计的程序。


程序解释:

程序正式运行时会列举出所有你存放在txt-collection文件夹下的txt文件,然后让你选择一个文件进行归类。

关于a程序的分类方法

以序号为单位,第一个空格至第二个空格多半为人名,首先提取并放置于excel表格第一列,第二个空格后放置于表格第二列,依次类推。

关于b程序的统计方法

b程序主要是统计仅有1与0(是与否)(参加与不参加)的统计程序,所以我将这一类内容单独拎出来进行jieba的统计,并利用模糊算法对统计内容进行预测,最终计数得出结果。


使用方法:

环境

requirement

  jieba==0.42.1
  prettytable==3.10.2

执行:

将你复制下来的接龙黏贴到txt文档里,放进txt-collection文件夹里。 文件夹允许同时存在多个接龙文档,命名随意,支持中文。 使用python执行runme.py即可,程序将会引导你执行每一步操作。

a选项将执行归类操作,也就是开头图片呈现的操作,他将为你的接龙文件进行excel表格的生成。

b选项将执行统计操作,但只能进行对出现次数的统计,它将为你的接龙文件进行excel表格的统计。

所有程序的执行都必须先经过a程序以后再进行下一个程序执行

a程序(分类)

程序没有太多注意事项,直接按照提示操作即可。 唯一可能要注意的点是有些人不懂怎么打开csv文件,这个就自行去百度吧。

b程序(统计)

开始的程序不会有太多问题(除非报错),但如果你遇到以下问题:

请输入你想要统计的词:(填入格式请见readme.md)

那么要注意,你必须输入1的词,也就是参加与不参加中的参加。 因为程序检索方式是频次,这样的话在询问参加与不参加的人中,出现参加一词的频次绝对最高,这样才能推出另一个0词就是不参加

不要我举例参加和不参加你们就写参加了啊喂。


一些建议:

程序运行于python环境下,你可以使用pycharm或者vscode等IDE进行开发,也可以使用python自带的IDLE进行运行。

但是注意:pycharm和vscode的路径管理模式不同,pycharm是以运行的程序为基准进行目录的构建,而vscode则是以打开的文件夹为基准构建

如果不理解也没关系,目前的文件排序方式应该是解决了这个问题。你只需继续按照原步骤直接运行runme.py即可

如果实在有问题就去issue区找,或者直接联系我。