借鉴了网上的一些结果做出来的东西,有很多小bug等待修复
使用python3
,并下载jieba
,wordcloud
库
-
data
-
templates
存储生成的词云的轮廓形状图片
-
stopwords.txt
存储忽略掉的关键词,可自己添加
-
-
fonts
存放字体文件
-
preprocess.py
用于去除昵称时间等不需要统计的东西
-
create_word_cloud.py
创建词云的python程序
运行
python preprocess.py filename.txt
来删除昵称等不需要统计的文字,生成__filename.txt
运行
python create_word_cloud.py __filename.txt
然后就在 out
文件夹里边生成词云了。
目前来说,聊天记录的名字最好是英文的,对中文的支持有一些问题