百万英雄答题助手

参考了微信跳一跳助手的思路，通过截取手机上面的题目，利用百度文字识别识别问题和答案。

运行

开启浏览器同步支持：

科普性知识测试

回锅肉属于什么菜系

北京奥运会是什么时候

简洁版本：

我什么都不会勒，但是想带女友打怪升级

真有一个办法，提供了小白版本：

无需下载配置复杂的工具链路
专人协助
一键运行，云端支持开发中

小白版本是基于目前的主干分支开发的，继承了主干分支的功能，主要是使用上面�配置的东西变少了，专门提供给不太懂技术的小白，大神请使用开源代码折腾。

小白版本 目前是需要收取一定的费用，价格是9.9，请走捐赠入口捐赠后联系，或者加微信也可以，微信在最下面。

只有 iphone, 没有 android 手机怎么办？

简单靠谱的办法是使用模拟器。

首先还是要下载adb工具，下文有介绍
下载夜神模拟器并安装
安装完成后，打开 cmd, 检查是否有模拟器设备 adb devices
在模拟器中安装答题应用
运行答题辅助脚本python main.py,如果有问题下文有解决办法，请参照安装步骤

支持捐赠

捐赠后请给我留言，如下福利：

项目结束后，整体讲解
免安装版提供支持，已完成，无需任何下载
无条件辅助安装包

百度OCR

notice: 百度的注册开发者后，创建应用就可以看见自己的 key 和 secret 。

部署

从python官网安装python3.6环境
pip install -r requirements.txt
创建默认的临时文件夹mkdir -p screenshots
修改默认的配置文件config.yaml,配置文件夹中可以配置临时数据目录和appcode

ADB工具配置

以 linux 为例：

下载 android-platform-tools，访问google下载，默认 mac，windows， linux 均支持
配置环境变量，进入 platform 目录下面export PATH=$(pwd):PATH配置 adb 工具到系统的 path 下面
手机打开开发者模式
使用usb连接手机后信任，adb devices来检查是否有自己的设备，确认已经连接
接下来就进入百万英雄，等待有题目的时候就运行python main.py即可

Release

2018/1/15: 增加芝士大会的支持，另外增加特别关键字

2018/1/14: 新增知识库功能, 内置adb，小白版一键运行

2018/1/13: 增加浏览器支持，修复部分bug

2018/1/12: 更改搜索策略，自动决策，减少python依赖

2018/1/11: 结巴分词预编译和多核分词优化

2018/1/10：增加ios分支，修复master文本摘要bug

2018/1/9：修复答案获取bug，增加长文本信息摘要算法，增加百度OCR

2018/1/9：使用相似度猜测答案，请切换分支使用

分支说明

master: 主要是 Android 手机使用，支持汉王 / 百度识别 / ocrspace
knearby: 根据文本关联度**，答案更加清晰，目前只支持百度识别

V2 文本关联相似度分析

对于答题这样的项目，首先一个问题，然后有三个答案可以选择，能不能通过分别统计问题与三个答案的关联度来选择出正确的答案，由于数据采集是来自百度的，可能会受到部分广告数据的影响，但是在集合相当大的情况下，关联度还是会呈现正相关。

假设题目是：

**历史上著名的科举制度开始于那个朝代？

汉朝
唐朝
隋朝

我们先用百度分别搜索汉朝，唐朝，隋朝，得到如下数据：

朝代	搜索出的数量（来自百度为您找到相关结果约）
汉朝	17900000
唐朝	30500000
隋朝	16600000

然后我们在用题目 + 答案的方式，搜索示例：

**历史上著名的科举制度开始于那个朝代？汉朝 得到三次的搜索结果：

关键字	搜索出的数量（来自百度为您找到相关结果约）
Q + 汉朝	602000
Q + 唐朝	837000
Q + 隋朝	658000

关联度计算方式：

K = count(Q&A) / (count(Q) * count(A))

关联度如下：

答案	关联度
汉朝	0.0336
唐朝	0.0274
隋朝	0.0396

贡献者（不分先后）

参考项目

交流学习

想要交流学习请添加我的 wechat , 群已经满了200人了，需要邀请进群。请优先加入qq群，很重要的改进可以加weixin:

请加qq后邀请：

qq: 2244741445

PeakJin/MillionHeroAssistant