查看2021年综述文献点这里↘️ 2021-CV-Surveys
2022 年,计算机视觉相关综述。包括目标检测、跟踪........
📗📗📗在【我爱计算机视觉】微信公众号后台回复“CV综述”,即可收到本文列出的全部论文的打包下载。至6月17日已公开 131 篇。
- 全景成像
- A Survey of Detection Methods for Die Attachment and Wire Bonding Defects in Integrated Circuit Manufacturing
[2022-06-16]
本文对用于检测这些缺陷的方法进行了调查或文献回顾,这些方法是基于所使用的不同传感方式,包括光学、放射学、声学和红外热成像。在这项调查中,对所使用的检测方法进行了讨论。传统的和深度学习的方法都被认为是检测芯片连接和电线连接缺陷的方法,同时也考虑了挑战和未来的研究方向。
- A Survey of Automated Data Augmentation Algorithms for Deep Learning-based Image Classication Tasks
[2022-06-15]
本篇综述从图像分类的角度讨论了AutoDA技术出现的根本原因。确定了标准AutoDA模型的三个关键组成部分:搜索空间、搜索算法和评估功能。基于它们的结构,对现有的图像AutoDA方法进行了系统的分类。本文介绍了AutoDA领域的主要工作,讨论了它们的优点和缺点,并提出了几个潜在的未来改进方向。
- Backbones-Review: Feature Extraction Networks for Deep Learning and Deep Reinforcement Learning Approaches
[2022-06-17]
- Detecting and Understanding Harmful Memes: A Survey
[2022-05-10]
有害 meme 检测综述
- 双聚类算法
- Spectral, Probabilistic, and Deep Metric Learning: Tutorial and Survey
[2022-01-25]
从spectral(谱系)、概率、深度学习三个方法中对度量学习进行调研回顾。
- 工业异常检测
- 视觉感官异常检测
- A Survey of Visual Sensory Anomaly Detection
[2022-02-16]
⭐code
首个视觉感官AD的全面调研工作
- A Survey of Visual Sensory Anomaly Detection
- 指纹活性检测
- Review of the Fingerprint Liveness Detection (LivDet) competition series: from 2009 to 2021
[2022-02-16]
对2009年至2021年的LivDet版本的指纹演示攻击检测(FPAD)算法的性能评估,并指出它们多年来的演变。
- Review of the Fingerprint Liveness Detection (LivDet) competition series: from 2009 to 2021
- 手掌静脉识别
- 自监督
- Deep Learning for Visual Speech Analysis: A Survey
[2022-05-24]
是对基于深度学习的VSA进行的全面回顾。其中专注于两个基本问题:视觉语音识别和视觉语音生成,并对现实的挑战和当前的发展,包括数据集、评估协议、代表方法、SOTA性能、实际问题等进行总结。
- 手写数字识别
- Two Decades of Bengali Handwritten Digit Recognition: A Survey
[2022-06-07]
本文分析了孟加拉语手写数字的特点和固有的模糊性,以及对二十年来最先进的数据集和离线BHDR方法的全面了解。
- Two Decades of Bengali Handwritten Digit Recognition: A Survey
- AR
- Augmented Reality and Robotics: A Survey and Taxonomy for AR-enhanced Human-Robot Interaction and Robotic Interfaces
[2022-03-08]
对AR增强型人机交互和机器人界面的调查和分类综述,共调研460篇相关文献。 - Modern Augmented Reality: Applications, Trends, and Future Directions
[2022-02-24]
- Augmented Reality and Robotics: A Survey and Taxonomy for AR-enhanced Human-Robot Interaction and Robotic Interfaces
- Learning with Capsules: A Survey
[2022-06-07]
- 视觉语言预训练
- VLP: A Survey on Vision-Language Pre-training
[2022-02-21]
本篇文章对视觉语言预训练(VLP)的最新进展和新领域进行了调研,包括图像-文本和视频-文本预训练。并表示这是第一份关于VLP的调研。希望它能对VLP领域的未来研究有所启示。 - A Survey of Vision-Language Pre-Trained Models
[2022-02-23]
本篇综述对 VL-PTMs 进行了回顾。其中说明了常用的架构,并对它们的优点和缺点进行了讨论。还介绍了几种预训练VL-PTM并使其适应下游任务的主流方法。 - Vision-and-Language Pretrained Models: A Survey
[2022-04-18]
- VLP: A Survey on Vision-Language Pre-training
- Visual Attention Methods in Deep Learning: An In-Depth Survey
[2022-04-19]
本篇综述回顾了 70 多篇与视觉应用中使用的各种注意力机制有关的文章。并对注意力技术以及它们的优点和局限性进行了全面的讨论。 - A survey on attention mechanisms for medical applications: are we moving towards better algorithms?
[2022-04-27]
- Semantic Segmentation for Thermal Images: A Comparative Survey
[2022-05-27]
热图像语义分割综述调研
- 剪枝
- Dimensionality Reduced Training by Pruning and Freezing Parts of a Deep Neural Network, a Survey
[2022-05-18]
通过 Pruning 和 Freezing 深层神经网络的部分内容进行降维训练调研
- Dimensionality Reduced Training by Pruning and Freezing Parts of a Deep Neural Network, a Survey
- ANN
- 深度估计
- 表面重建
- 深度补全
- Deep Depth Completion: A Survey
[2022-05-12]
- Deep Depth Completion: A Survey
- Generative Adversarial Networks for Image Augmentation in Agriculture: A Systematic Review
[2022-04-12]
GAN在农业中的图像增强作用综述 - A Comprehensive Survey on Data-Efficient GANs in Image Generation
[2022-04-19]
对更全面跟系统的 DE-GANs 的调研。 - Combating COVID-19 using Generative Adversarial Networks and Artificial Intelligence for Medical Images: A Scoping Review
[2022-05-17]
本篇论文全面研究了 GANs 在解决 COVID-19 数据稀缺和诊断相关挑战方面的作用。
- SuperNet in Neural Architecture Search: A Taxonomic Survey
[2022-04-11]
神经架构搜索的 SuperNet 分类法调研
- Unsupervised Representation Learning for Point Clouds: A Survey
[2022-03-01]
⭐code
本篇综述对使用 DNN 的无监督点云表征学习进行了全面回顾。 - Sequential Point Clouds: A Survey
[2022-04-21] - 点云补全
- Continuous Human Action Recognition for Human-Machine Interaction: A Review
[2022-03-01] - A Survey on Video Action Recognition in Sports: Datasets, Methods and Applications
[2022-06-03] - 动作质量评估
- A Survey of Video-based Action Quality Assessment
[2022-04-21]
对基于视频的动作质量评估的现有论文进行了全面的调查。
- A Survey of Video-based Action Quality Assessment
- A Review of Deep Learning Based Image Super-resolution Techniques
[2022-01-26] - 单图像分辨率
- Multi-modal Sensor Fusion for Auto Driving Perception: A Survey
[2022-02-08]
本篇综述对现有的基于多模态的自主驾驶感知任务的方法进行了文献调研。其中包含 50 多篇利用感知传感器(包括LiDAR和相机)试图解决目标检测和语义分割任务的论文。期望为自主驾驶感知任务提出一个新的多模态融合方法分类法,并引发对未来基于融合技术的思考。 - 三维人体运动预测
- 3D Human Motion Prediction: A Survey
[2022-03-04]
本篇综述系统地回顾了 2015 年以来人类运动预测领域的所有相关期刊和会议论文,并对相关方法、数据集、基准、性能进行了讨论分析。
- 3D Human Motion Prediction: A Survey
- 行为预测
- 鱼眼相机
- Surround-view Fisheye Camera Perception for Automated Driving: Overview, Survey and Challenges
[2022-05-27]
用于自动驾驶的环视鱼眼相机感知综述调研
- Surround-view Fisheye Camera Perception for Automated Driving: Overview, Survey and Challenges
- 地图
- A survey of top-down approaches for human pose estimation
[2022-02-08]
本篇论文的目的是为研究人员提供基于深度学习方法的二维图像的人体姿态估计的广泛回顾,自2016年以来,这些方法只专注于自上而下的方法。 - 3D人体网格结构恢复
- Recovering 3D Human Mesh from Monocular Images: A Survey
[2022-03-04]
⭐code
本篇报告对过去十年中的三维人体网状结构恢复方法进行了全面的概述,是第一篇专注于单目三维人体网状结构恢复任务的调查报告。
- Recovering 3D Human Mesh from Monocular Images: A Survey
- 2D人体姿态估计
- 2D Human Pose Estimation: A Survey
[2022-04-18]
对 200 多项研究贡献,从 network architecture design(网络架构设计)、network training refinement(网络训练细化)和 post processing(后处理)三个方向对二维人体姿态估计进行了全面调研。
- 2D Human Pose Estimation: A Survey
- 3D手部姿势估计
- Image Compression(图像压缩)
- Learning-Driven Lossy Image Compression; A Comprehensive Survey
[2022-01-25]
本篇综述是对过去五年的利用ML架构进行有损图像压缩技术的调研。
- Learning-Driven Lossy Image Compression; A Comprehensive Survey
- 去模糊
- Blind Image Deblurring: a Review
[2022-01-26] - Deep Image Deblurring: A Survey
[2022-01-27] - A Survey on Image Deblurring
[2022-02-16]
本篇图像去模糊综述分别对传统的图像去模糊方法和深度表示的图像去模糊方法进行了全面调研。
- Blind Image Deblurring: a Review
- 图像修复
- 图像增强
- Hyperspectral Unmixing
- Hyperspectral Unmixing Based on Nonnegative Matrix Factorization: A Comprehensive Review
[2022-05-23]
本篇文章作者对为高光谱解混提出的基于NMF的方法进行了全面调研。
- Hyperspectral Unmixing Based on Nonnegative Matrix Factorization: A Comprehensive Review
- Fake Detection
- A Survey of Deep Fake Detection for Trial Courts
[2022-06-01]
- A Survey of Deep Fake Detection for Trial Courts
- Single Object Tracking Research: A Survey
[2022-04-26]
本文介绍了近十年来视频目标跟踪领域两大主流算法框架(基于相关滤波和孪生网络的目标跟踪算法)的基本原理、改进策略和代表性工作,之后按照网络结构分类介绍了其他基于深度学习的目标跟踪算法,还从解决目标跟踪所面临挑战的角度介绍了应对各类问题的典型解决方案,并总结了视频目标跟踪的历史发展脉络和未来发展趋势。 - Siamese Object Tracking for Unmanned Aerial Vehicle: A Review and Comprehensive Analysis
[2022-05-10]
⭐code
本文对领先的 Siamese 跟踪器进行了全面的回顾,同时基于使用典型的无人机机载处理器的评估,对无人机进行了详尽的具体分析。 - RGBT Tracking
- A Survey for Deep RGBT Tracking
[2022-01-25]
本篇综述是对近期基于深度神经网络的RGBT追踪器的全面调研,得出MDNet和Siamese架构在RGBT任务中的两个主流框架,前者取得了更高的性能,而后者则满足了实时性要求。以及应对更大数据集应用时,应进一步考虑整合端到端框架,如Siamese和Transformer,以满足实时性以及更强的性能。
- A Survey for Deep RGBT Tracking
- 视觉目标跟踪
- Visual Object Tracking on Multi-modal RGB-D Videos: A Review
[2022-01-25]
本篇综述的目的是总结RGB-D跟踪研究中的相关知识。
- Visual Object Tracking on Multi-modal RGB-D Videos: A Review
- 多目标跟踪
- Recent Advances in Embedding Methods for Multi-Object Tracking: A Survey
[2022-05-24]
对多目标跟踪(MOT)中的嵌入方法进行了全面调查和深入分析。
- Recent Advances in Embedding Methods for Multi-Object Tracking: A Survey
- 3D Object Detection
- Survey and Systematization of 3D Object Detection Models and Methods
[2022-01-25]
本篇综述是对过去10年中大量不同的3D目标检测方法的全面调研。 - 3D Object Detection from Images for Autonomous Driving: A Survey
[2022-02-08]
⭐code
本篇论文是第一项调查基于图像的自主驾驶 3D 检测方法的工作。其中包含 80 多个基于图像的 3D 检测方法和从 2015 年到 2021 年间的 200 多个相关研究工作。
- Survey and Systematization of 3D Object Detection Models and Methods
- 结构裂缝检测
- What's Cracking? A Review and Analysis of Deep Learning Methods for Structural Crack Segmentation, Detection and Quantification
[2022-02-09]
本篇综述旨在让研究人员对裂缝分析算法领域内已发表的利用深度学习的工作有一个概览。
- What's Cracking? A Review and Analysis of Deep Learning Methods for Structural Crack Segmentation, Detection and Quantification
- 坑洞检测
- 持续目标检测
- 视频理解
- 视频分析
- A Comprehensive Review of Computer Vision in Sports: Open Issues, Future Trends and Research Directions
[2022-03-07]
本文对体育视频分析的各种应用进行了全面的回顾,如球员的检测和分类,跟踪体育运动中的球员或球,预测球员或球的轨迹,识别球队的策略,对体育中的各种事件进行分类。
- A Comprehensive Review of Computer Vision in Sports: Open Issues, Future Trends and Research Directions
- 视频监控
- Drivers' attention detection: a systematic literature review
[2022-04-11]
驾驶员注意力检测综述
- Drivers' attention detection: a systematic literature review
- Video Transformers: A Survey
[2022-01-19] - Recent Advances in Vision Transformer: A Survey and Outlook of Recent Work
[2022-03-04]
⭐code - Transformers in 3D Point Clouds: A Survey
[2022-05-17]
旨在全面介绍为各种任务(如点云分类、分割、目标检测等)设计的 3D Transformers。 - 多模态学习
- Multimodal Learning with Transformers: A Survey
[2022-06-15]
本文对面向多模态数据的Transformer技术进行了全面调查。该调查的主要内容包括 (1)多模态学习、Transformer生态系统和多模态大数据时代的背景,(2)从几何拓扑学的角度对Vanilla Transformer、Vision Transformer和多模态Transformer进行了理论回顾,(3)通过两个重要范式对多模态Transformer的应用进行回顾,即。(4)总结多模态变换器模型和应用的共同挑战和设计,(5)讨论社区的开放问题和潜在研究方向。
- Multimodal Learning with Transformers: A Survey
- 基于 UAV 的三维重建
- 深度估计
- A Survey on RGB-D Datasets
[2022-01-19]
- A Survey on RGB-D Datasets
- A Survey on Face Recognition Systems
[2022-01-11] - 跨光谱人脸识别
- 口罩人脸检测
- GAN-face检测
- GAN-generated Faces Detection: A Survey and New Perspectives
[2022-02-16]
本次综述旨在对 GAN-face 检测的最新进展进行全面回顾。并着重研究能够检测由 GAN 模型生成或合成的人脸图像的方法。
- GAN-generated Faces Detection: A Survey and New Perspectives
- 眼周生物识别技术
- 人脸属性编辑
- A comprehensive survey on semantic facial attribute editing using generative adversarial networks
[2022-05-24]
使用生成式对抗网络进行人脸属性语义编辑的全面调查
- A comprehensive survey on semantic facial attribute editing using generative adversarial networks
- 无人机
- 空中监测
- The State of Aerial Surveillance: A Survey
[2022-01-11]
从计算机视觉和模式识别的角度对以人为中心的空中监视任务进行全面调研。
- The State of Aerial Surveillance: A Survey
- 空中监测
- 遥感
- Deep Learning in Multimodal Remote Sensing Data Fusion: A Comprehensive Review
[2022-05-04]
基于 DL 的多模态RS数据融合的系统概况
- Deep Learning in Multimodal Remote Sensing Data Fusion: A Comprehensive Review
- 张量分解
- Tensor Decompositions for Hyperspectral Data Processing in Remote Sensing: A Comprehensive Review
[2022-05-16]
遥感中高光谱数据处理的张量分解
- Tensor Decompositions for Hyperspectral Data Processing in Remote Sensing: A Comprehensive Review
- 步态识别
- Gait Recognition Based on Deep Learning: A Survey
[2022-01-11]
本篇综述提供一个关于通过步态识别进行生物识别的最新工作的调查汇编,重点是深度学习方法,强调其优点,并揭露其缺点。此外,它还对数据集、方法和架构进行分类和描述,以解决相关的限制。
- Gait Recognition Based on Deep Learning: A Survey
- Deep Learning for Computational Cytology: A Survey
[2022-02-13]
本篇综述调研了 120 多篇基于深度学习的方法在计算细胞学中的进展。 - Deep Multi-modal Fusion of Image and Non-image Data in Disease Diagnosis and Prognosis: A Review
[2022-03-30] - Transforming medical imaging with Transformers? A comparative review of key properties, current progresses, and future perspectives
[2022-06-03] - Multiple Instance Learning for Digital Pathology: A Review on the State-of-the-Art, Limitations & Future Potential
[2022-06-10] - A Review of Causality for Learning Algorithms in Medical Image Analysis
[2022-06-14] - Machine learning approaches for COVID-19 detection from chest X-ray imaging: A Systematic Review
[2022-06-14]
本文对应用于利用胸部X光图像进行COVID-19检测的ML进行了系统回顾,目的是在方法、架构、数据库和目前的局限性方面为研究人员提供一个基线。 - 自动检测
- Deep Learning Applications for Lung Cancer Diagnosis: A systematic review
[2022-01-04]
本篇综述是对深度学习在肺癌自动检测领域应用的全面调研,其中回顾文献是 2016 年至 2021 年该领域的 32 篇会议和期刊文章。 - AI-based Carcinoma Detection and Classification Using Histopathological Images: A Systematic Review
[2022-01-20] - Automated image analysis in large-scale cellular electron microscopy: A literature survey
[2022-06-16]
本篇综述回顾了当前自动化计算机技术的最先进水平和细胞EM结构分析的主要挑战。讨论了过去五年中为自动生物医学图像分析而开发的先进的计算机视觉、深度学习和软件工具,涉及到EM数据的标注、分割和可扩展性。自动图像采集和分析的整合将允许对具有纳米级分辨率的毫米级数据集进行高通量分析。
- Deep Learning Applications for Lung Cancer Diagnosis: A systematic review
- 胎儿生长监测
- Towards deep observation: A systematic survey on artificial intelligence techniques to monitor fetus via Ultrasound Images
[2022-01-21]
本次调研研究了2010年到2021年之间发表的文献,旨在探索人工智能(AI)如何通过超声(US)图像协助胎儿生长监测。
- Towards deep observation: A systematic survey on artificial intelligence techniques to monitor fetus via Ultrasound Images
- 组织病理学分析
- What Can Machine Vision Do for Lymphatic Histopathology Image Analysis: A Comprehensive Review
[2022-01-24]
本篇综述对近年来基于 MV 的图像处理技术在淋巴瘤组织病理学图像中的应用,包括分割、分类和检测进行了全面回顾。
- What Can Machine Vision Do for Lymphatic Histopathology Image Analysis: A Comprehensive Review
- Transformer
- Transformers in Medical Imaging: A Survey
[2022-01-25]
⭐code
本篇综述试图对 Transformer 在医学影像中的应用(分割、检测、分类、重建、合成、配准、临床报告生成等)进行全面回顾,涵盖从近期所提出的架构设计到未解决的问题等各个方面。 - Transformers in Medical Image Analysis: A Review
[2022-02-25]
本文围绕 Transformer 在不同学习范式中的使用、提高模型效率以及与其他技术的耦合等方面的关键挑战进行了全面研究。
- Transformers in Medical Imaging: A Survey
- 加密医疗图像
- 跨模态脑图像合成
- A Survey of Cross-Modality Brain Image Synthesis
[2022-02-16]
⭐code
首个通过考虑监督水平来深入审查跨模态脑图像合成任务的工作,特别是对于无监督和半监督的跨模态合成。
- A Survey of Cross-Modality Brain Image Synthesis
- 微生物
- A Comprehensive Survey with Quantitative Comparison of Image Analysis Methods for Microorganism Biovolume Measurements
[2022-02-21]
本篇文章通过 60 多篇文献对基于 DIP 的微生物生物量测量进行全面回顾。
- A Comprehensive Survey with Quantitative Comparison of Image Analysis Methods for Microorganism Biovolume Measurements
- 医学图像分类
- Mammograms Classification: A Review
[2022-03-09]
- Mammograms Classification: A Review
- 医学图像分割
- U-Net and its variants for Medical Image Segmentation : A short review
[2022-04-20] - Application of belief functions to medical image segmentation: A review
[2022-05-05]
对使用信任函数理论的医学图像分割方法进行了回顾。 - A Survey of Left Atrial Appendage Segmentation and Analysis in 3D and 4D Medical Images
[2022-05-16]
对三维和四维医学图像(包括CT、MRI和超声心动图图像)上的自动LAA分割方法进行了回顾。 - 皮损分割
- A Survey on Deep Learning for Skin Lesion Segmentation
[2022-06-02]
对134篇涉及基于深度学习的皮损分割的研究论文调研
- A Survey on Deep Learning for Skin Lesion Segmentation
- U-Net and its variants for Medical Image Segmentation : A short review
- 乳腺癌检测
- 青光眼自动检测
- Automatic detection of glaucoma via fundus imaging and artificial intelligence: A review
[2022-04-13]
通过对 28 篇相关论文,对产生和使用分割眼底图像的人工智能青光眼检测框架进行了审查。
- Automatic detection of glaucoma via fundus imaging and artificial intelligence: A review
- 可解释性
- 微循环图像
- p Learning and Computer Vision Techniques for Microcirculation Analysis: A Revi
[2022-05-12]
本篇文章对50多篇研究论文进行了调查,并提出最相关和最有前途的计算机视觉算法,以实现微循环图像的自动化分析。
- p Learning and Computer Vision Techniques for Microcirculation Analysis: A Revi
- Scene Graph Generation: A Comprehensive Survey
[2022-01-04]
本篇综述对深度学习技术在这一领域所带来的最新成果进行了全面的调查。回顾了138项涵盖不同输入模式的代表性工作,并从特征提取和融合的角度系统地总结了现有的基于图像的SGG方法。
- Artificial Intelligence for Suicide Assessment using Audiovisual Cues: A Review
[2022-01-25]
本篇综述对通过视听特征分析研究自杀意念和自杀行为检测的工作进行了全面调研回顾,主要是自杀性声音/语音声学特征分析和自杀性视觉线索。 - A Review of Emerging Research Directions in Abstract Visual Reasoning
[2022-02-22] - A systematic review and meta-analysis of Digital Elevation Model (DEM) fusion: pre-processing, methods and applications
- A Review of Mobile Mapping Systems: From Sensors to Applications
[2022-06-01] - 城市规划
- Visual and Object Geo-localization: A Comprehensive Survey
[2022-01-03]
本篇综述对涉及图像的地理定位进行了全面的调查,其中包括确定图像的拍摄地点(图像地理定位)或图像中物体的地理定位(物体地理定位)。
- Visual and Object Geo-localization: A Comprehensive Survey
- Data-Free Knowledge Transfer: A Survey
[2022-01-03]
本篇综述对 Data-Free 知识迁移进行了全面和结构化的调研。 - Empirical Evaluation and Theoretical Analysis for Representation Learning: A Survey
[2022-04-19] - Image Data Augmentation for Deep Learning: A Survey
[2022-04-20] - 正则化
- Avoiding Overfitting: A Survey on Regularization Methods for Convolutional Neural Networks
[2022-01-11]
本次调研工作就对过去几年开发的几种正则化方法进行分析,并将调研文献分为“input regularization”、“internal regularization”、“label regularization”三类,且相关文献不超过五年以及所有文献代码都可以在公共资源库中找到。
- Avoiding Overfitting: A Survey on Regularization Methods for Convolutional Neural Networks
- 可视化
- DL4SciVis: A State-of-the-Art Survey on Deep Learning for Scientific Visualization
[2022-04-14]
本篇文章是关于 DL4SciVis 的最先进的调研,涵盖了自 2017 年以来沿着六个维度发表的 59 篇论文,对其相似性和差异性进行了深入讨论,确定其趋势和差距,并概述了研究机会和公开挑战。
- DL4SciVis: A State-of-the-Art Survey on Deep Learning for Scientific Visualization