paperweekly_bot 拆分自paperweekly_forum,是其组件之一,当时为paperweek设计,多数需求也来自群友的讨论,具体设计可以参考我的这篇文章:论坛机器人的技术实现
这部分似乎挺多人都需要(我的两个朋友的创业公司都用到它,最近infoq和ai100也打算采用)
所以我将它单独拆分出来,独立维护
- 消息云端存储、持久化(建议来自@MT)
- 消息管理界面
- es6/webpack/react
- 维持心跳 * 两个机器人 互相ping pong
- 大群模式(需求来自@蒋涛)
- 由管理员开启开关
- 支持任意群互通
- 支持web页面扫码
- websocket
- 掉线消息提醒
- 模块化,打包发布
- 文档
- 增加用户头像
- 升级itchat到1.2.18
- 将用户头像upload到云端,同时做好本地缓存,避免每个用户都存储(使用md5)
- 在本地存下hash和url (有一次img data网络请求)
- 单次优化,存下3元组(data_hash,userName,url) 只要有任意一个就不做网络请求
- 使用py.test写测试:py.test test_localuser.py (vim !py.test -s %)
- 构建本地存储(peewee),和云端存储继承自同一个类,通过设置文件设置
- 使用bokeh可视化数据
- 动态查询数据库(使用export_csv)
- 可视化
- 分词/词云
- 使用按钮一次触发所有条件
- 从旧版本的log中提取message,存入本地数据库,方便pandas使用(使用grep)
- 测试
head -n 200 wechat_3group.log |grep "INFO:__main__:('201-"
- 提取所有信息
grep "INFO:__main__:('201-" wechat_3group.log > grep_wechat_3group.log
(tmux) - "\u54c8\u54c8".decode("unicode_escape")
- 测试
sudo apt-get install libpq-dev python-dev libjpeg-dev libfreetype6-dev
git clone https://github.com/wwj718/paperweekly_bot
pip install -r requirements.txt
set -x LEANCLOUD_APP_ID xxx # or export LEANCLOUD_APP_ID=xxx
set -x LEANCLOUD_APP_KEY xxx
python db_store # 创建本地数据库(默认是sqlite,也可自行替换为mysql、PostgreSQL
python wechat_group_bot.py
使用leancloud,每条消息对象包括以下属性:
- group_name
- group_user_name
- content
- created time
详情参考leancloud管理台
bokeh serve --show bokeh_app
接受所有的请求: bokeh serve --show bokeh_app --host "*" --port 5100 --address 0.0.0.0
如果想在生产环境用,可以看我之前的项目配置:jobsVisualization
最近准备使用superset