更新：0.2.1

现在，自己要求的读图只在当前会话中、当前群聊、自己有用。OCR状态也更改为对单个群聊（所有会话和用户）有效，且可以设置默认是否有效。对比0.1版本中，发起一次请求，在别的群或私聊中，别的会话，别人也能用，且不同群发起会冲突。OCR状态为全局。

Readim插件：微信Bot读取图像内容和文字

插件描述

本插件用于使机器人可以阅读图像中的内容和文字。

本插件基于chatgpt-on-wechat. 但本人偏离主仓库太多，可能存在兼容性错误。

环境要求

sudo apt-get update
sudo apt-get install tesseract-ocr

pip install pytesseract Pillow

根据需求安装语言，具体参照tesseract-ocr/tesseract

sudo apt-get install tesseract-ocr-chi-sim  # 简体中文
sudo apt-get install tesseract-ocr-chi-tra  # 繁体中文

如果你打算使用和我一样的本地blip2：

pip install git+https://github.com/huggingface/transformers.git
pip install accelerate

本地使用blip2需要10G左右的显存或内存，cpu运行耗时尚可接受，但推荐使用gpu可以实现实时回复。

如果和sdwebui同时使用，插件提供了每次用完模型将模型转移到内存中的功能，即看图时才占用显存，不与绘画占显存冲突。但正在绘图时启用看图会抢显存报错。我给出一个解决方法：写一个bash脚本单独用于启动webui，然后再相关地方捕捉显存错误，用subprocess杀死卡住的webui并且重启，如图：