lironghuo/attack-and-defense-methods

A curated list of papers of adversarial examples and defense methods.

MIT

About

Inspired by this repo and ML Writing Month. Questions and discussions are most welcome!

Lil-log is the best blog I have ever read!

Papers

Survey

Attack

2013

ICLR Evasion Attacks against Machine Learning at Test Time

2014

ICLR Intriguing properties of neural networks

2015

ICLR Explaining and Harnessing Adversarial Examples

2016

EuroS&P The limitations of deep learning in adversarial settings
CVPR Deepfool
SP C&W Towards evaluating the robustness of neural networks
Arxiv Transferability in machine learning: from phenomena to black-box attacks using adversarial samples
NIPS [Adversarial Images for Variational Autoencoders]

2017

ICLR Delving into Transferable Adversarial Examples and Black-box Attacks
CVPR Universal Adversarial Perturbations
ICCV Adversarial Examples for Semantic Segmentation and Object Detection
ARXIV Adversarial Examples that Fool Detectors
CVPR A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection
ICCV Adversarial Examples Detection in Deep Networks with Convolutional Filter Statistics
AIS [Adversarial examples are not easily detected: Bypassing ten detection methods]
ICCV UNIVERSAL [Universal Adversarial Perturbations Against Semantic Image Segmentation]

2018

ICLR Generating Natural Adversarial Examples
NeurlPS Constructing Unrestricted Adversarial Examples with Generative Models
IJCAI Generating Adversarial Examples with Adversarial Networks
CVPR Generative Adversarial Perturbations
AAAI Learning to Attack: Adversarial transformation networks
S&P Learning Universal Adversarial Perturbations with Generative Models
CVPR Robust physical-world attacks on deep learning visual classification
ICLR Spatially Transformed Adversarial Examples
CVPRBoosting Adversarial Attacks With Momentum
CVPR UNIVERSAL [Art of Singular Vectors and Universal Adversarial Perturbations]
ARXIV [Adversarial Spheres]
ICML [Obfuscated Gradients Give a False Sense of Security: Circumventing Defenses to Adversarial Examples]
ECCV [Characterizing adversarial examples based on spatial consistency information for semantic segmentation]

2019

CVPR Feature Space Perturbations Yield More Transferable Adversarial Examples
ICLR The Limitations of Adversarial Training and the Blind-Spot Attack
ICLR Are adversarial examples inevitable? 💭
IEEE TEC One pixel attack for fooling deep neural networks
ARXIV Generalizable Adversarial Attacks Using Generative Models
ICML NATTACK: Learning the Distributions of Adversarial Examples for an Improved Black-Box Attack on Deep Neural Networks💭
ARXIV SemanticAdv: Generating Adversarial Examples via Attribute-conditional Image Editing
CVPR Rob-GAN: Generator, Discriminator, and Adversarial Attacker
ARXIV Cycle-Consistent Adversarial {GAN:} the integration of adversarial attack and defense
ARXIV Generating Realistic Unrestricted Adversarial Inputs using Dual-Objective {GAN} Training 💭
ICCV Sparse and Imperceivable Adversarial Attacks💭
ARXIV Perturbations are not Enough: Generating Adversarial Examples with Spatial Distortions
ARXIV Joint Adversarial Training: Incorporating both Spatial and Pixel Attacks
IJCAI Transferable Adversarial Attacks for Image and Video Object Detection
TPAMI Generalizable Data-Free Objective for Crafting Universal Adversarial Perturbations
CVPR Decoupling Direction and Norm for Efficient Gradient-Based L2 Adversarial Attacks and Defenses
CVPR [FDA: Feature Disruptive Attack]
ARXIV [SmoothFool: An Efficient Framework for Computing Smooth Adversarial Perturbations]
CVPR [SparseFool: a few pixels make a big difference]
ICLR [Adversarial Attacks on Graph Neural Networks via Meta Learning]

2020

ICLR Fooling Detection Alone is Not Enough: Adversarial Attack against Multiple Object Tracking💭
ARXIV [Sponge Examples: Energy-Latency Attacks on Neural Networks]

Defence

2014

ARXIV Towards deep neural network architectures robust to adversarial examples

2016

NIPS Robustness of classifiers: from adversarial to random noise 💭

2017

ARXIV Countering Adversarial Images using Input Transformations
ICCV [SafetyNet: Detecting and Rejecting Adversarial Examples Robustly]
Arxiv Detection Detecting adversarial samples from artifacts
ICLR Detection On Detecting Adversarial Perturbations 💭

2018

2019

NIPS Adversarial Training and Robustness for Multiple Perturbations
NIPS Adversarial Robustness through Local Linearization
CVPR Retrieval-Augmented Convolutional Neural Networks against Adversarial Examples
CVPR Feature Denoising for Improving Adversarial Robustness
NEURIPS A New Defense Against Adversarial Images: Turning a Weakness into a Strength
ICML Interpreting Adversarially Trained Convolutional Neural Networks
ICLR Robustness May Be at Odds with Accuracy💭
IJCAI Improving the Robustness of Deep Neural Networks via Adversarial Training with Triplet Loss
ICML Adversarial Examples Are a Natural Consequence of Test Error in Noise💭
ICML On the Connection Between Adversarial Robustness and Saliency Map Interpretability
NeurIPS Metric Learning for Adversarial Robustness
ARXIV Defending Adversarial Attacks by Correcting logits
ICCV Adversarial Learning With Margin-Based Triplet Embedding Regularization
ICCV CIIDefence: Defeating Adversarial Attacks by Fusing Class-Specific Image Inpainting and Image Denoising
NIPS Adversarial Examples Are Not Bugs, They Are Features
ICML Using Pre-Training Can Improve Model Robustness and Uncertainty
NIPS Defense Against Adversarial Attacks Using Feature Scattering-based Adversarial Training💭
ICCV Improving Adversarial Robustness via Guided Complement Entropy
NIPS Robust Attribution Regularization 💭
CVPR [Adversarial defense by stratified convolutional sparse coding]
ICLR [Theoretically Principled Trade-off between Robustness and Accuracy]

2020

4th-Class

ICCV 2017 CVAE-GAN: Fine-Grained Image Generation Through Asymmetric Training
ICML 2016 Autoencoding beyond pixels using a learned similarity metric
ARXIV 2019 Natural Adversarial Examples
ICML 2017 Conditional Image Synthesis with Auxiliary Classifier {GAN}s
ICCV 2019 SinGAN: Learning a Generative Model From a Single Natural Image
ICLR 2020 Robust And Interpretable Blind Image Denoising Via Bias-Free Convolutional Neural Networks
ICLR 2020 Pay Attention to Features, Transfer Learn Faster CNNs
ICLR 2020 On Robustness of Neural Ordinary Differential Equations
ICCV 2019 Real Image Denoising With Feature Attention
ICLR 2018 Multi-Scale Dense Networks for Resource Efficient Image Classification
ARXIV 2019 Rethinking Data Augmentation: Self-Supervision and Self-Distillation
ICCV 2019 Be Your Own Teacher: Improve the Performance of Convolutional Neural Networks via Self Distillation
ARXIV 2019 Adversarially Robust Distillation
ARXIV 2019 Knowledge Distillation from Internal Representations
ICLR 2020 Contrastive Representation Distillation 💭
NIPS 2018 Faster Neural Networks Straight from JPEG
ARXIV 2019 A Closer Look at Double Backpropagation💭
CVPR 2016 Learning Deep Features for Discriminative Localization
ICML 2019 Noise2Self: Blind Denoising by Self-Supervision
ARXIV 2020 Supervised Contrastive Learning
ARXIV 2020 [An Adversarial Approach for Explaining the Predictions of Deep Neural Networks]
CVPR 2014 [Rich feature hierarchies for accurate object detection and semantic segmentation]
ICLR 2018 [Spectral Normalization for Generative Adversarial Networks]
NIPS 2018 [MetaGAN: An Adversarial Approach to Few-Shot Learning]
ARXIV 2019 [Breaking the cycle -- Colleagues are all you need]
ARXIV 2019 [LOGAN: Latent Optimisation for Generative Adversarial Networks]

Links

Adversarial Machine Learning Reading List by Nicholas Carlini
A Complete List of All (arXiv) Adversarial Example Papers by Nicholas Carlini Stay Tuned