CVPR2021最新信息及已接收论文/代码(持续更新)

本贴是对 CVPR2021 已接受论文的粗略汇总，后期会有更详细的总结。期待ing......

官网链接：http://cvpr2021.thecvf.com
开会时间：2021年6月19日-6月25日
论文接收公布时间：2021年2月28日

📗📗📗下载已公开论文在【我爱计算机视觉】后台回复“CVPR2021”，即可收到。目前已公开 654 篇。

CVPR2021最新信息及已接收论文/代码(持续更新)

🎆🎆🎆更新提示：4月29日新增4篇

🎆🎆🎆更新提示：4月28日新增4篇

🐱	🐶	🐭	🐹	🐯
Workshop征稿
70.迁移学习	69.计数	68.CV 综合	67.缺陷检测	66.光流估计
64.语音处理	63.图像处理	62.手绘草图识别	61.算法
60. SLAM/AR/机器人	59.深度学习模型	58.度量学习	57.手语识别	56.光学、几何、光场成像
55.图匹配	54.情感预测	53.数据集	52.图像/视频生成	51.对比学习
50.OCR	49.对抗学习	48.图像表示	47.视觉语言VL	46.人物交互HOI
45.相机定位	44.图像/视频字幕	43.主动学习	42.动作预测	41.表示学习（图像+字幕）
40.超像素	39.模型偏见消除	38.类增量学习	37.持续学习	36.动作检测与识别
35.图像聚类	34.图像/细粒度分类	33.6D位姿估计	32.视图合成	31. 开放集识别
30.新视角合成	29.姿态估计	28.密集预测	27.语义线检测	26.视频相关技术
25.三维视觉	24.强化学习	23.自动驾驶	22.医学影像	21.Transformer/Self-attention
20.人员重识别/人群计数	19.量化、剪枝、蒸馏、模型压缩与优化	18.航空影像	17.超分辨率	16.视觉问答
15.GAN	14.小/零样本学习，域适应，域泛化	13.图像检索	12.图像增广	11.人脸技术
10.神经架构搜索	9.目标跟踪	8.图像分割	7.目标检测	6.数据增强
5.异常检测	4.自/半/弱监督学习	3.点云	2.图卷积网络GNN	1.未分类

70.迁移学习

69.Crowd Counting-计数

68.CV 综合

67.缺陷检测

66.光流估计

65.风格迁移

64.语音处理

63.图像处理

62.手绘草图识别

61.算法

60. SLAM/AR/机器人

59.深度学习模型

58.度量学习（相似度学习）

57.手语识别

56.光学、几何、光场成像

55.图匹配

54.情感预测

53.数据集

52.图像生成 Image Generation/Synthesis

51.对比学习

50.OCR

49.对抗学习

48.图像表示Image Representation

47.视觉语言vision-language

46.人物交互（human-object interaction）

45.相机定位(Camera Localization)

44.图像/视频字幕

43.主动学习

42.动作预测

41.表示学习（图像+字幕）

40.超像素

39.模型偏见消除

38.类增量学习（class-incremental learning）

37.持续学习

Rainbow Memory: Continual Learning with a Memory of Diverse Samples
Training Networks in Null Space for Continual Learning
😮oral⭐code

36.动作检测与识别

35.图像聚类

34.图像分类

33.6D位姿估计

32.视图合成

31.开放集识别

30.新视角合成

29.姿态估计

28.密集预测

27.语义线检测

26.视频相关技术

25.三维视觉

24.强化学习

23.自动驾驶

22.医学影像

21.Transformer

Transformer Interpretability Beyond Attention Visualization
⭐code
MIST: Multiple Instance Spatial Transformer Network
试图从热图中进行可微的top-K选择(MIST)（目前在自然图像上也有了一些结果；) 用它可以在没有任何定位监督的情况下进行检测和分类（并不是它唯一能做的事情!）
Variational Transformer Networks for Layout Generation

20.人员重识别

19.量化、剪枝、蒸馏、模型压缩/扩展与优化

18.航空影像/无人机

17.超分辨率

16.视觉问答

Weakly-supervised Grounded Visual Question Answering using Capsules

15.GAN

14.小/零样本学习，域适应，域泛化

13.图像/视频检索

12.图像增强

11. 人脸技术

10.神经架构搜索

9.目标跟踪

8.图像分割

7.目标检测

Multiple Instance Active Learning for Object Detection
⭐code
Positive-Unlabeled Data Purification in the Wild for Object Detection
Depth from Camera Motion and Object Detection
⭐github📺video
通过使用“普通手机摄像头运动+目标检测的包围框”数据，设计RNN网络实现了达到最先进精度的目标深度估计。
Towards Open World Object Detection
😮oral⭐code
General Instance Distillation for Object Detection
近年来，知识蒸馏已被证明是模型压缩的有效解决方案。可以使轻量级的学生模型获得从繁琐的教师模型中提取的知识，但以往的检测蒸馏方法对于不同的检测框架的泛化能力较弱，而且严重依赖ground truth（GT），忽略了实例之间有价值的关系信息。为此，作者在本文中提出新的基于判别性实例的检测任务蒸馏方法，不考虑 GT 区分的正负，命名为通用实例蒸馏（GID）。该方法包含一个通用实例选择模块(GISM)，可以充分利用基于特征、基于关系和基于响应的知识进行蒸馏。实验验证，学生模型在各种检测框架中可以实现显著的 AP 改进，甚至优于教师模型。具体来说，RetinaNet 与 ResNet-50 在 COCO 数据集上用 GID 实现了39.1% 的 mAP，比基线 36.2% 超出了 2.9%，甚至优于基于 ResNet-101 的教师模型 38.1% 的 AP。
Distilling Object Detectors via Decoupled Features
MeGA-CDA: Memory Guided Attention for Category-Aware Unsupervised Domain Adaptive Object Detection
Informative and Consistent Correspondence Mining for Cross-Domain Weakly Supervised Object Detection
😮oral

6.数据增广

5.异常检测

4.自/半/弱监督学习

3.点云

2.图卷积网络GNN

1.未分类

Inverting the Inherence of Convolution for Visual Recognition
Representative Batch Normalization with Feature Calibration
UC2: Universal Cross-lingual Cross-modal Vision-and-Language Pretraining
Reconsidering Representation Alignment for Multi-view Clustering
Self-supervised Simultaneous Multi-Step Prediction of Road Dynamics and Cost Map
Instance Localization for Self-supervised Detection Pretraining
⭐code
Model-Contrastive Federated Learning
提出模型对比学习来解决联合学习中的非IID数据问题
Neural Geometric Level of Detail:Real-time Rendering with Implicit 3D Surfaces
😮Oral⭐code🏠project
Data-Free Model Extraction
⭐code
Single-Stage Instance Shadow Detection with Bidirectional Relation Learning
😮oral⭐code
Continual Adaptation of Visual Representations via Domain Randomization and Meta-learning
😮oral
PatchmatchNet: Learned Multi-View Patchmatch Stereo
😮oral⭐code
[Online Bag-of-Visual-Words Generation for Unsupervised Representation Learning]
[Semantic Palette: Guiding Scene Generation with Class Proportions]
Function4D: Real-time Human Volumetric Capture from Very Sparse Consumer RGBD Sensors
😮oral
POSEFusion:Pose-guided Selective Fusion for Single-view Human Volumetric Capture
😮oral
Multi-Objective Interpolation Training for Robustness to Label Noise
⭐code
Right for the Right Concept: Revising Neuro-Symbolic Concepts by Interacting with their Explanations
⭐code
Simpler Certified Radius Maximization by Propagating Covariances
😮oral📺video
Nutrition5k: Towards Automatic Nutritional Understanding of Generic Food
Discovering Hidden Physics Behind Transport Dynamics
😮oral
Soft-IntroVAE: Analyzing and Improving the Introspective Variational Autoencoder
😮oral⭐code🏠project
Deep Gradient Projection Networks for Pan-sharpening
⭐code
Consensus Maximisation Using Influences of Monotone Boolean Functions
😮oral

Forecasting Irreversible Disease via Progression Learning
Causal Hidden Markov Model for Time Series Disease Forecasting
Towards Unified Surgical Skill Assessment

Workshop 征稿ing

Visual Perception for Navigation in Human Environments
第二届人类环境导航视觉感知征稿 ⚠️4月15截止
UG 2 + Challenge
旨在通过应用图像恢复和增强算法提高分析性能，推动对 "difficult"图像的分析。参与者任务是开发新的算法，以改进对在问题条件下拍摄的图像分析。
👑10K美元奖金
- 低能见度环境下的目标检测
  - 雾霾条件下的(半)监督目标检测
  - (半)低光条件下的人脸检测
- 黑暗视频中的动作识别
  - 黑暗中进行完全监督动作识别
  - 黑暗中进行半监督动作识别
Continual Learning in Computer Vision 征稿中
旨在聚集学术界和工业界的研究人员和工程师，讨论持续学习的最新进展。
- Best paper award: 500 USD + 500 USD worth of Huawei cloud credits (HUAWEI)
- Overall Challenge winner: 1,000 USD + 500 USD worth of Huawei cloud credits (HUAWEI)
- Supervised-Learning track winner: 500 USD (HUAWEI)
- Reinforcement-Learning track winner: 500 USD (ServiceNow)
第四届UG2研讨会和竞赛：弥合计算成像与视觉识别之间的鸿沟
10万美元奖金！CVPR 2021 重磅赛事，安全AI挑战者计划
- CVPR 2021大赛，安全AI 之防御模型的「白盒对抗攻击」解析
- 还在刷榜ImageNet？找出模型的脆弱之处更有价值！
Responsible Computer Vision
⚠️3月25日截止
本次研讨会将广泛讨论计算机视觉背景下负责任的人工智能的三个主要方面：公平性；可解释性和透明度；以及隐私。
Holistic Video Understanding
目的是建立一个整合所有语义概念联合识别的视频基准，因为每个任务的单一类标签往往不足以描述视频的整体内容。
ThreeDWorld Transport Challenge
⚠️6月1截止
📺video
FGVC 8
第八届细粒度视觉分类研讨会（FGVC8）将通过细粒度视觉理解的视角，探讨细粒度学习、自监督学习、半监督学习、matching(匹配)、localization(定位)、域适应、迁移学习、小样本学习、机器教学、多模态学习（如音频和视频）、众包和分类学预测等相关话题。
⚠️论文截稿日期为4月2日
征稿主题包含以下几个方面
- Fine-grained categorization细粒度分类
  - Novel datasets and data collection strategies for fine-grained categorization用于细粒度分类的新型数据集和数据收集策略
  - Appropriate error metrics for fine-grained categorization细粒度分类的适当误差指标
  - Low/few shot learning少/小样本学习
  - Self-supervised learning自监督学习
  - Semi-supervised learning半监督学习
  - Transfer-learning from known to novel subcategories
  - Attribute and part based approaches
  - Taxonomic predictions
  - Addressing long-tailed distributions
- Human-in-the-loop
  - Fine-grained categorization with humans in the loop
  - Embedding human experts’ knowledge into computational models
  - Machine teaching
  - Interpretable fine-grained models
- Multi-modal learning
  - Using audio and video data
  - Using geographical priors
  - Learning shape
- Fine-grained applications
  - Product recognition
  - Animal biometrics and camera traps
  - Museum collections
  - Agricultural
  - Medical
  - Fashion
- 相关挑战赛如下（部分已在Kaggle网站开始）
  - GeoLifeCLEF2021
    利用观测结果与航空图像和环境特征配对，预测物种的存在
  - Semi-iNat2021
    由iNaturalist的数据组成的半监督细粒度图像分类
  - iNatChallenge2021
    对1万类动植物进行图像分类挑战赛
  - iMet2021
    对艺术品进行细粒度属性分类
  - iMat-Fashion2021未开始
    服装实例分割和细粒度属性分类
  - Hotel-ID 2021
    从图像中识别酒店房间
  - HerbariumChallenge2021
    从数据集中识别标本，该数据集包含来自美洲、大洋洲和太平洋地区的近66,000种 vascular plant species（维管束植物）的 2.5M 图像
  - iWildCam2021
    对图像序列中每个物种的动物数量计数
  - PlantPathologyChallenge2021未开始
    对病害植物的图像进行分类

azuredsky/CVPR-2021-Papers

CVPR2021最新信息及已接收论文/代码(持续更新)

📗📗📗下载已公开论文在【我爱计算机视觉】后台回复“CVPR2021”，即可收到。目前已公开 654 篇。

CVPR2021最新信息及已接收论文/代码(持续更新)

🎆🎆🎆更新提示：4月30日新增11篇

目录

70.迁移学习

69.Crowd Counting-计数

68.CV 综合

67.缺陷检测

66.光流估计

65.风格迁移

64.语音处理

63.图像处理

62.手绘草图识别

61.算法

60. SLAM/AR/机器人

59.深度学习模型

58.度量学习（相似度学习）

57.手语识别

56.光学、几何、光场成像

55.图匹配

54.情感预测

53.数据集

52.图像生成 Image Generation/Synthesis

51.对比学习

50.OCR

49.对抗学习

48.图像表示Image Representation

47.视觉语言vision-language

46.人物交互（human-object interaction）

45.相机定位(Camera Localization)

44.图像/视频字幕

43.主动学习

42.动作预测

41.表示学习（图像+字幕）

40.超像素

39.模型偏见消除

38.类增量学习（class-incremental learning）

37.持续学习

36.动作检测与识别

35.图像聚类

34.图像分类

33.6D位姿估计

32.视图合成

31.开放集识别

30.新视角合成

29.姿态估计

28.密集预测

27.语义线检测

26.视频相关技术

25.三维视觉

24.强化学习

23.自动驾驶

22.医学影像

21.Transformer

20.人员重识别

19.量化、剪枝、蒸馏、模型压缩/扩展与优化

18.航空影像/无人机

17.超分辨率

16.视觉问答

15.GAN

14.小/零样本学习，域适应，域泛化

13.图像/视频检索

12.图像增强

11. 人脸技术

10.神经架构搜索

9.目标跟踪

8.图像分割

7.目标检测

6.数据增广

5.异常检测

4.自/半/弱监督学习

3.点云

2.图卷积网络GNN

1.未分类

Workshop 征稿ing

扫码CV君微信（注明：CVPR）入微信交流群：