/LvmamaKitTest

利用图像识别技术解决非原生控件的定位问题

Primary LanguageJava

LvmamaKitTest

利用图像识别技术解决非原生控件的定位问题

缘起

前天同桌妹纸问一个控件怎么定位的问题,我张口就来,ID,xpath。。。。。妹纸说这些我都试过了,还是无法定位,不信我Debug给你看。N种方法尝试后,只能接受现实,非原生控件,于是老脸一红,告诉妹纸,这是非原生控件,无法通过常规方式定位。搜索了一下,很多帖子都反映过这个问题,但是都没给出解决策略。不知道这些小伙伴最终有没有解决。遂决定,吃个大闸蟹,研究一下看能否解决。

非原生控件给自动化带来的痛点

  • View里控件都定位不到

  • 控件随机变化(如支付密码键) 密码键盘每次页面打开或者页面刷新键位都不一样 Image text

  • 常规定位方式无法识别 智能货架,经常变换的显示位置 Image text

常规解决方式

  • 坐标大法:但是坐标大法对于有些随机变化密码键就无法操作了。
  • 开发配合:给特定的app包,解除安全键盘。这种操作无异于饮鸩止渴。

图像识别尝试

由于我们页面控件不会像验证码那么多干扰难识别,现在图形识别技术Java,Python,C++等都非常成熟。一通百度后在OpenCV 发现了matchTemplate 方法,在图片中找指定的图片。主要用的以下两种方法:

  • 使用OpenCV函数 matchTemplate 在模板块和输入图像之间寻找匹配,获得匹配结果图像
  • 使用OpenCV函数 minMaxLoc 在给定的矩阵中寻找最大和最小值(包括它们的位置).

具体实现

  1. 截取图

  2. 滑动到非原生控件,使元素可见

  3. 截取截目画面即为原图像

  4. 用画图工具打开原图像(不要人为放大或者缩小原图像),截取非原生控件的图像即为模板图像

  5. 原图像: Image text

  6. 如下用画图工具打开,保证分别率不变下截取目标图像作为模板图像 Image text

  7. 模板图像(非原生控件图像)

  8. 取坐标

  9. 执行OpenCV函数 matchTemplate获取坐标

  10. 为方便公司同事和社区伸手党使用,直接上码 LvmamaKit代码工程Git传送门,调用LvmamaKit.find2BElementPoint4Debug会在原图像上标识出是否匹配成功

  11. 第二步成功后,调用LvmamaKit.find2BElementPoint返回Json格式坐标

  12. 回显示意图,忽略图片失真 Image text

  13. 调用LvmamaKit.find2BElementPoint返回Json格式坐标,自行计算出中心坐标 {"x":"309","y":"854","width":"105","height":"82"}

  14. 点坐标

  15. 拷贝返回的坐标,进行相对计算

  16. 点击相对坐标,完成你的自动化用例

  17. 识别密码 1.密码键盘,1-9随机变,图像识别妥妥的搞定。 示意图

  18. 搞定收工

  19. 明天可以给妹子解决非原生控件的定位问题咯

参考资料