XiaoKai Bot 小开机器人

用 Python 编写的即时聊天平台机器人，通过适配器模式支持使用多种 bot 框架／平台作为消息源（目前支持 Mojo-Webqq、Mojo-Weixin、CoolQ HTTP API），支持自定义插件。

请注意区分此程序和其它模拟登录或封装接口的聊天平台客户端，此程序不负责登录或维护即时聊天平台的账号的状态，而只负责收到消息之后对消息的分析、处理、回复等逻辑，本程序通过适配器来与所支持的聊天平台客户端进行通讯，通常包括上报数据的统一化、调用接口获取额外信息、发送消息等，而这些聊天平台客户端（很多时候它们的项目名称也是「某某 bot」，相当于机器人的前端）需要你自行运行。

如何运行

预备

首先你需要了解如何运行你需要的消息源。以 Mojo-Weixin 为例，查看它的官方使用文档来了解如何运行，其它消息源基本类似。

注意消息源必须已有相应的消息源适配器，消息源的概念解释及目前支持的消息源见消息源列表。

配置

复制 config.sample.py 为 config.py，然后修改 config.py 中的 message_sources 字段，定义你需要的消息源，例如：

{
    'via': 'mojo_weixin',
    'login_id': 'your_login_id',
    'superuser_id': 'your_superuser_id',
    'api_url': 'http://127.0.0.1:5001/openwx',
}

上面的定义了一个 Mojo-Weixin 消息源，登录号是 your_login_id，超级用户 ID 是 your_superuser_id，Mojo-Weixin API 地址是 http://127.0.0.1:5001/openwx，via 和 login_id 是必须的，其它字段根据不同消息源适配器可能略有不同，具体请查看消息源列表。

与此同时，当你决定了本 bot 程序要运行的 IP 和端口之后，要把相应的上报 URL 填写到消息源程序的配置参数中，上报 URL 格式必须为 http://your_host:your_port/<string:via>/<string:login_id>，这里可以见到 via 和 login_id，即为之前定义消息源时必填的项，用来唯一确定一个消息来源。比如如果你使用 Mojo-Weixin 登录一个 bot，微信号为 my_bot，而本 bot 程序跑在 127.0.0.1 的 8888 端口，那么你需要在 Mojo-Weixin 的参数中设置 post_url 为 http://127.0.0.1:8888/mojo_weixin/my_bot。

运行

推荐使用 Docker 运行，因为基本可以一键开启，如果你想手动运行，也可以参考第二个小标题「手动运行」。

使用 Docker 运行

本仓库根目录下的 docker-compose.yml 即为 Docker Compose 的配置文件，直接跑就行（某些功能可能需要自行修改一下 docker-compose.yml 里的环境变量，例如如果要使用天气功能，需要在里面填上你的和风天气 API KEY）。如果你想对镜像进行修改，可以自行更改 Dockerfile 来构建或者继承已经构建好的镜像。

手动运行

pip3 install -r requirements.txt
python3 app.py

你可以通过设置环境变量来控制程序的某些行为，请参考 docker-compose.yml 文件中的最后一个容器的环境变量设置。

如何使用

如果不是出于修改程序以适应自己的需求的目的，建议直接使用已经跑起来的小开 bot 即可，使用文档见如何使用 CCZU 小开机器人。而如果是自行修改，那么使用方式就由你自己的插件决定了。

下面是一个示例的使用截图：

局限性

这里不讨论消息源客户端的局限性，那不是后端所负责的范围。只讨论本程序（聊天机器人后端）的局限性：

直接忽略了所有事件类型的上报，比如好友请求、群请求，只接受消息类型
目前只能处理文字消息（微信语音消息会通过语音识别转成文字）

配置文件

本程序的配置文件（config.py）非常简单，重要的配置只有消息源定义、默认命令等，还有一些对标记的定义，如命令开始标记、命令名与参数分割标记等，基本上都是字面义，通过字段名即可明白，这里不再给出具体的文档。

消息源适配器

简称「适配器」，用来在消息源和本程序之间进行数据格式的转换，相当于一个驱动程序，通过不同的驱动程序，本程序便可以接入多种聊天平台。用户可以自行开发适配器来适配尚未支持的消息源，见编写消息源适配器。

插件

程序支持三种插件形式，分别是过滤器／Filter、命令／Command、自然语言处理器／NLProcessor，也即程序的三个处理层次。

用户可以自行编写插件来扩展功能，具体请看文档。下面简要介绍三层命令的执行流程。

过滤器

收到消息后，依次运行所有过滤器，即按照优先级从大到小顺序运行 filters 目录中的 .py 文件中指定的过滤器函数，函数返回非 False 即表示不拦截消息，从而消息继续传给下一个过滤器，如果返回了 False，则消息不再进行后续处理，而直接抛弃。

命令

命令分发器（filters/command_dispatcher0.py)是一个预设的优先级为 0 的过滤器，它根据命令的开始标志判断消息中有没有指定命令，如果指定了，则执行指定的命令，如果没指定，则看当前用户有没有开启交互式会话，如果开启了会话，则执行会话指定的命令，否则，使用默认的 fallback 命令（config.py 中 fallback_command 指定，默认为 natural_language.process）。

自然语言处理器

程序默认的 fallback 命令是 natural_language.process，也即自然语言处理命令，这个命令会通过消息的分词结果寻找注册了相应关键词的 NL 处理器并调用它们，得到一个有可能的等价命令列表，然后选择其中置信度最高且超过 60 的命令作为最佳识别结果执行。如果没有超过 60 的命令，则调用另一个 fallback 命令（config.py 中 fallback_command_after_nl_processors 指定，默认为 ai.tuling123）。

starlightme/xiaokai-bot