English | 中文
PaddleVideo
近期更新
- 添加成功后回复【视频】加入交流群
简介
PaddleVideo是飞桨官方出品的视频模型开发套件,旨在帮助开发者更好的进行视频领域的学术研究和产业实践。
模型案例库
模型
行为识别方法 | ||||
PP-TSM (PP series) | PP-TSN (PP series) | PP-TimeSformer (PP series) | TSN (2D’) | TSM (2D‘) |
SlowFast (3D’) | TimeSformer (Transformer‘) | VideoSwin (Transformer’) | AttentionLSTM (RNN‘) | MoViNet (Lite‘) |
基于骨骼点的动作识别方法 | ||||
ST-GCN (GCN’) | AGCN (GCN‘) | CTR-GCN (GCN‘) | ||
时序动作检测方法 | ||||
BMN (One-stage‘) | ||||
视频时序分割 | ||||
MS-TCN | ASRF | |||
时空动作检测方法 | ||||
SlowFast+Fast R-CNN | ||||
多模态 | ||||
ActBERT (Learning‘) | T2VLAD (Retrieval‘) | |||
视频目标分割 | ||||
CFBI (Semi‘) | MA-Net (Supervised‘) | |||
单目深度估计 | ||||
ADDS (Unsupervised‘) |
数据集
动作识别 | |||
Kinetics-400 (Homepage) (CVPR'2017) | UCF101 (Homepage) (CRCV-IR-12-01) | ActivityNet (Homepage) (CVPR'2015) | YouTube-8M (Homepage) (CVPR'2017) |
动作定位 | |||
ActivityNet (Homepage) (CVPR'2015) | |||
时空动作检测 | |||
AVA (Homepage) (CVPR'2018) | |||
基于骨架的动作识别 | |||
NTURGB+D (Homepage) (IEEE CS'2016) | FSD (Homepage) | ||
单目深度估计 | |||
Oxford-RobotCar (Homepage) (IJRR'2017) | |||
文本视频检索 | |||
MSR-VTT (Homepage) (CVPR'2016) | |||
文本视频预训练 | |||
HowTo100M (Homepage) (ICCV'2019) |
应用案例
Applications | Descriptions |
---|---|
FootballAction | 足球动作检测方案 |
BasketballAction | 篮球动作检测方案 |
TableTennis | 乒乓球动作识别方案 |
FigureSkating | 花样滑冰动作识别方案 |
VideoTag | 3000类大规模视频分类方案 |
MultimodalVideoTag | 多模态视频分类方案 |
VideoQualityAssessment | 视频质量评估方案 |
PP-Care | 3DMRI医疗图像识别方案 |
EIVideo | 视频交互式分割工具 |
Anti-UAV | 无人机检测方案 |
AbnormalActionDetection | 异常行为检测方案 |
PP-Human | 行人分析场景动作识别方案 |
文档教程
- AI-Studio教程
- 贡献代码
赛事支持
许可证书
本项目的发布受Apache 2.0 license许可认证。
致谢
- 非常感谢 mohui37、zephyr-fun、voipchina 贡献相关代码