/video_structured

detect a video file to output structure

Primary LanguageC++MIT LicenseMIT

功能介绍

项目实现如下功能:

scene_detect 视频分析主程序

  • 获取视频文件的基本信息

  • 通过内容或阈值分析视频场景,进行切割;

  • 对切割后的场景,预测图片场景的场所;

  • 调用百度接口,实现的7个功能,如下所示;

  • YoloV3 识别多种物体种类和数量。

face_detection- 人脸识别

text_recognition- 网络图片中的文字识别,也叫OCR

body_analysis- 人体关键点识别 | 人体属性识别 | 人流量统计 | 手势识别 | 人像分割

依赖项

Python 3.6 或以上版本,其他依赖项及其版本在 requirements.txt 有描述。

自行搜索安装 Python 3.6 环境 / 虚拟环境;

安装requirements里面所列依赖项:

pip3 install -U -r requirements.txt

运行并打印信息

命令行下,进入 yolov3/checkpoints 目录下,运行如下命令,下载预训练的权重参数文件:

bash download_yolov3_weights.sh

命令行下或其他开发工具类似环境中,进入项目根目录, 运行如下命令:

python scene_detect.py

信息打印顺序:

视频文件信息 -> 视频场景切割 -> 视频中场景识别 -> aip接口7功能 -> 视频中的物体识别

单一功能测试:

详细键值信息,参考: https://ai.baidu.com/docs#/Face-Detect-V3/top

运行并返回json

python face_detection.py

python aip_OCR.py

python body_analysis.py

联系方式

如有任何问题,请联络: Taylor Guo at taylorguo@126.com