detect stages in video automatically
Type | Status |
---|---|
package version | |
python version | |
auto test | |
code maintainability | |
code coverage | |
docker build status | |
code style |
2020/05/21:目前,该项目已经达到一个较为稳定的状态,并顺利在多家头部公司、团队落地,作为正式工具存在。Bug跟踪与建议请优先通过 issue 联系我,感谢所有支持过这个项目的人:)
这段视频展示了一个应用的完整启动过程:
将视频传递给 stagesepx,它将自动分析拆解,得到视频中所有的阶段。包括变化的过程及其耗时,以及在稳定的阶段停留的时长:
你可以据此得到每个阶段对应的精确耗时。
当然,它是天然跨端的,例如web端。甚至,任何端:
与视频一致的高准确度。以秒表为例:
可以看到,与秒表的表现几乎没有差异。请注意,这里的准确度指的是 stagesepx 能够精确还原视频本身的数据与表现。而对于现象(例如某某时间点出现什么状态)而言,准确度很大程度上取决于视频本身,如fps/分辨率等。
如果比起报告,更希望亲自处理原始数据,进而进行二次开发,你可以直接将 report 部分去除。如此做,你将得到一个 python 对象供你随意使用。它提供了大量的API,例如转换成字典:
{
"data": [{
"data": null,
"frame_id": 1,
"stage": "0",
"timestamp": 0.0,
"video_path": "../demo.mp4"
}, {
"data": null,
"frame_id": 2,
"stage": "0",
"timestamp": 0.04,
"video_path": "../demo.mp4"
}, {
"data": null,
"frame_id": 3,
"stage": "0",
"timestamp": 0.08,
"video_path": "../demo.mp4"
}, {
...
从这个字典中我们可以知道,每一帧分别对应的:
- 被分类到哪一个类别
- 时间戳
- 帧编号
- ...
用户可以随意处理这些数据,无论是保存或是交给下一段代码。
- 既然它是可编程的,那么它必然是朝着彻底替代人力的方向演进的。这也是它最强大的特性;
- 它允许用户利用自己的训练集进行模型训练,利用神经网络进行规模化、全自动化的特定阶段耗时计算;
- 此方案能够被广泛应用到各类业务迭代中,与持续集成配合,有效降低人力消耗;
具体可参见 将 stagesepx 应用到实际业务中。
- 标准模式下无需前置训练与学习
- 更少的代码需要
- 高度可配置化,适应不同场景
- 支持与其他框架结合,融入你的业务
- 所有你需要的,只是一个视频
你可以直接通过命令行使用,而无需编写脚本:
stagesepx analyse your_video.mp4 report.html
基于此,你可以非常方便地利用 shell 建立工作流。以 android 为例:
adb shell screenrecord --time-limit 10 /sdcard/demo.mp4
adb pull /sdcard/demo.mp4 .
stagesepx analyse demo.mp4 report.html
关于结果不准确的问题请参考 #46。
在正式落地时,推荐使用 完整的python脚本 而不是命令行,以保证更高的可编程性。完整的落地例子另外单独开了一个 repo 存放,传送门。
- 用30行代码快速跑一个demo
- 30行代码怎么没有注释
- 还有更多配置吗
- 我想看看实际落地方案,最好有把饭喂嘴里的例子
- 我们的app很复杂,能搞定吗
- 太麻烦了,有没有开箱即用、简单配置下可以落地的工具
- 我有问题要问
- 官方文档
标准版(pypi)
pip install stagesepx
预览版(github):
pip install --upgrade git+https://github.com/williamfzc/stagesepx.git
最终我还是决定通过 issue 面板维护所有的 Q&A ,毕竟问题的提出与回复是一个强交互过程。如果在查看下列链接之后你的问题依旧没有得到解答:
- 请 新建issue
- 或在相关的 issue 下进行追问与补充
- 你的提问将不止帮助到你一个人 :)
问题列表:
- 安装过程遇到问题?
- 如何根据图表分析得出app启动的时间?
- 日志太多了,如何关闭或者导出成文件?
- 我的视频有 轮播图 或 干扰分类 的区域
- 分类结果如何定制?
- 算出来的结果不准确 / 跟传统方式有差距
- 出现 OutOfMemoryError
- 工具没法满足我的业务需要
- 为什么报告中的时间戳跟实际不一样?
- 自定义模型的分类结果不准确,跟我提供的训练集对不上
- ...
不仅是问题,如果有任何建议与交流想法,同样可以通过 issue 面板找到我。我们每天都会查看 issue 面板,无需担心跟进不足。
在 1.0版本 之前,我们接下来的工作主要分为下面几个部分:
随着越来越多的业务落地,我们开始思考它是否能够作为行业级别的方案。
- 基于实验室数据的准确度对比(未公开)
- 规范且适合落地的例子
- 边界情况下的确认
- 代码覆盖率 95%+
- API参数相关文档
该部分由 issue 面板管理。
欢迎感兴趣的同学为这个项目添砖加瓦,三个必备步骤:
- 请在开始编码前留个 issue 告知你想完成的功能,因为可能这个功能已经在开发中或者已有;
- commit规范我们严格遵守 约定式提交;
- 该repo有较为完善的单测与CI以保障整个项目的质量,在过去的迭代中发挥了巨大的作用。所以请为你新增的代码同步新增单元测试(具体写法请参考 tests 中的已有用例)。
- 邮箱:
fengzc@vip.qq.com
- QQ:
178894043