Image Fusion

This repository contains code reproductions of existing state-of-the-art image fusion models, our work is still in progress.

多模态图像融合(Multi-Modal Image Fusion)

红外和可见光图像融合(Infrared and visible image fusion)

方法	标题	论文	代码	发表期刊或会议	基础框架	监督范式	发表年份	引用量	复现情况
DenseFuse	DenseFuse: A Fusion Approach to Infrared and Visible Images	Paper	Code	TIP	AE	自监督	2019	569	✓
FusionGAN	FusionGAN: A generative adversarial network for infrared and visible image fusion	Paper	Code	InfFus	GAN	无监督	2019	711
DDcGAN	Learning a Generative Model for Fusing Infrared and Visible Images via Conditional Generative Adversarial Network with Dual Discriminators	Paper	Code	IJCAI	GAN	无监督	2019	51
NestFuse	NestFuse: An Infrared and Visible Image Fusion Architecture Based on Nest Connection and Spatial/Channel Attention Models	Paper	Code	TIM	AE	自监督	2020	125	✓
DDcGAN	DDcGAN: A dual-discriminator conditional generative adversarial network for multi-resolution image fusion	Paper	Code	TIP	GAN	无监督	2020	307	✓
DIDFuse	DIDFuse: Deep Image Decomposition for Infrared and Visible Image Fusion	Paper	Code	IJCAI	AE	自监督	2020	40
RFN-Nest	RFN-Nest: An end-to-end residual fusion network for infrared and visible images	Paper	Code	InfFus	AE	自监督	2021	112	✓
CSF	Classification Saliency-Based Rule for Visible and Infrared Image Fusion	Paper	Code	TCI	AE	自监督	2021	19
DRF	DRF: Disentangled Representation for Visible and Infrared Image Fusion	Paper	Code	TIM	AE	自监督	2021	41
SEDRFuse	SEDRFuse: A Symmetric Encoder–Decoder With Residual Block Network for Infrared and Visible Image Fusion	Paper	Code	TIM	AE	自监督	2021	43	✓
MFEIF	Learning a Deep Multi-Scale Feature Ensemble and an Edge-Attention Guidance for Image Fusion	Paper		TCSVT	AE	自监督	2021	38
Meta-Learning	Different Input Resolutions and Arbitrary Output Resolution: A Meta Learning-Based Deep Framework for Infrared and Visible Image Fusion	Paper		TIP	CNN	无监督	2021	15
RXDNFuse	RXDNFuse: A aggregated residual dense network for infrared and visible image fusion	Paper	Code	InfFus	CNN	无监督	2021	27
STDFusionNet	STDFusionNet: An Infrared and Visible Image Fusion Network Based on Salient Target Detection	Paper	Code	TIM	CNN	无监督	2021	67
D2LE	A Bilevel Integrated Model With Data-Driven Layer Ensemble for Multi-Modality Image Fusion	Paper		TIP	CNN	无监督	2021	33
HAF	Searching a Hierarchically Aggregated Fusion Architecture for Fast Multi-Modality Image Fusion	Paper	Code	ACM MM	CNN	无监督	2021	5
SDDGAN	Semantic-supervised Infrared and Visible Image Fusion via a Dual-discriminator Generative Adversarial Network	Paper	Code	TMM	GAN	无监督	2021	7
Detail-GAN	Infrared and visible image fusion via detail preserving adversarial learning	Paper	Code	InfFus	GAN	无监督	2021	206
Perception-GAN	Image fusion based on generative adversarial network consistent with perception	Paper	Code	InfFus	GAN	无监督	2021	28
GAN-FM	GAN-FM: Infrared and Visible Image Fusion Using GAN With Full-Scale Skip Connection and Dual Markovian Discriminators	Paper	Code	TCI	GAN	无监督	2021	19
AttentionFGAN	AttentionFGAN: Infrared and Visible Image Fusion Using Attention-Based Generative Adversarial Networks	Paper		TMM	GAN	无监督	2021	71
GANMcC	GANMcC: A Generative Adversarial Network With Multiclassification Constraints for Infrared and Visible Image Fusion	Paper	Code	TIM	GAN	无监督	2021	109
MgAN-Fuse	Multigrained Attention Network for Infrared and Visible Image Fusion	Paper		TIM	GAN	无监督	2021	30
TC-GAN	Infrared and Visible Image Fusion via Texture Conditional Generative Adversarial Network	Paper		TCSVT	GAN	无监督	2021	23
AUIF	Efficient and model-based infrared and visible image fusion via algorithm unrolling	Paper	Code	TCSVT	AE	自监督	2021	14
TarDAL	Target-aware Dual Adversarial Learning and a Multi-scenario Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection	Paper	Code	CVPR	GAN	无监督	2022	21	✓
RFNet	RFNet: Unsupervised Network for Mutually Reinforcing Multi-modal Image Registration and Fusion	Paper	Code	CVPR	CNN	无监督	2022	7
SeAFusion	Image fusion in the loop of high-level vision tasks: A semantic-aware real-time infrared and visible image fusion network	Paper	Code	InfFus	CNN	无监督	2022	52
PIAFusion	PIAFusion: A progressive infrared and visible image fusion network based on illumination aware	Paper	Code	InfFus	CNN	无监督	2022	20
UMF-CMGR	Unsupervised Misaligned Infrared and Visible Image Fusion via Cross-Modality Image Generation and Registration	Paper	Code	IJCAI	CNN	无监督	2022	11
DetFusion	DetFusion: A Detection-driven Infrared and Visible Image Fusion Network	Paper	Code	ACM MM	CNN	无监督	2022	2
DIVFusion	DIVFusion: Darkness-free infrared and visible image fusion	Paper	Code	InfFus	CNN	无监督	2023	1

Datasets

M3FD数据集

M3FD 包含高分辨率的红外和可见图像，涵盖各种场景下的不同对象类型我们将 M3FD 中的所有 4200 个对齐对分为四种典型类型，即 Daytime、Overcast、Night 和 Challenge，其中有 10 个子场景如图 4 所示。同时，我们注释了 6 个类别的 33603 个对象，即人像 , 汽车, 公共汽车, 摩托车, 卡车和灯, 常见于监控和自动驾驶。 M3FD 的数量和多样性为通过融合图像学习和评估目标检测提供了可能性。

下载地址

谷歌盘https://drive.google.com/drive/folders/1H-oO7bgRuVFYDcMGvxstT1nmy0WF_Y_6?usp=sharing

百度云https://pan.baidu.com/s/1GoJrrl_mn2HNQVDSUdPCrw?pwd=M3FD

LLVIP数据集

LLVIP数据集包含 30976 张图像即15488 对，其中大部分是在非常黑暗的场景下拍摄的，并且所有图像在时间和空间上都严格对齐，且数据集中的行人被标记。

● 用于低光视觉的可见红外配对数据集

● 30976 张图像（15488 对）

● 24个黑暗场景，2个白天场景

● 支持图像到图像的转换（可见光到红外线，或红外线到可见光）、可见光和红外图像融合、弱光行人检测和红外行人检测

下载地址

谷歌盘

源数据raw：https://drive.google.com/u/0/uc?id=1a0zNvj1mBh1v_HFWJ43LFbNEq8YLXB9-&export=download

对齐数据：https://drive.google.com/u/0/uc?id=1Jmm0Id-rZbmCj6JmJIzv5ld_scM6dkCt&export=download

注册下载：https://bupt-ai-cz.github.io/LLVIP/

IRVI数据集

IRVI数据集，具体来说，它有12个连续的车辆和监控场景视频片段，红外和可见光视频都可以分割成24352帧。综合实验验证，I2V-GAN 在翻译 I2V 视频方面优于对比的 SOTA 方法，具有更高的流畅度和更精细的语义细节。

下载地址

谷歌盘https://drive.google.com/file/d/1ZcJ0EfF5n_uqtsLc7-8hJgTcr2zHSXY3/view?usp=sharing

百度云https://pan.baidu.com/s/1og7bcuVDModuBJhEQXWPxg?pwd=IRVI

COCO数据集

COCO 是一个大规模的对象检测、分割和字幕数据集。COCO有几个特点：

● 对象分割

● 上下文识别

● 超像素东西分割

● 330K 图像（>200K 标记）

● 150 万个对象实例

● 80 个对象类别

● 91个东西类别

● 每张图片 5 个标题

● 25万人有重点

下载地址

coco128

coco128-账号密码：pimat87260@letpays.com

直链地址：https://ultralytics.com/assets/coco128.zip

https://paperswithcode.com/sota/object-detection-on-coco

coco

https://cocodataset.org/#download

TNO数据集

TNO 多带图像收集系统提供了不同军事和监视场景的强化视觉(390-700nm) ，近红外(700-1000nm)和长波红外(8-12μm)夜间图像，显示不同的物体和目标(例如人，车辆)在不同的背景(例如农村，城市)。该数据集可用于开发静态和动态图像融合算法、颜色融合算法、多光谱目标检测和识别算法以及弱小目标检测算法。

下载地址

https://figshare.com/articles/dataset/TNO_Image_Fusion_Dataset/1008029

INO数据集

INO数据集是由加拿大光学研究所发布的, 它包含了几对在不同天气和环境下的可见光和红外视频。比如：BackyardRunner、CoatDeposit、GroupFight、MulitpleDeposit 等。在对预训练模型测试过程中，一般从几个视频序列中随机挑选一些帧来验证模型的有效性。

下载地址

直链地址：https://inostorage.blob.core.windows.net/media/1546/ino_crossroads.zip

RoadScene数据集

RoadScene 数据集包含221 对红外和可见光图像，它们选自于FLIR 视频序列，包含了丰富的生活场景，比如：马路、交通工具、行人等。该数据集对原始的红外图像的背景热噪声进行了预处理，并准确对齐红外和可见光图像对，最终裁剪出精确的配准区域以形成该数据集。

下载地址

直链地址：https://github.com/hanna-xu/RoadScene/archive/refs/heads/master.zip

MSRS数据集

MFNet 数据集包含 1,569 个图像对（白天拍摄的 820 个，夜间拍摄的 749 个），空间分辨率为 480 × 640。但是，MFNet 数据集中存在许多未对齐的图像对，并且大多数红外图像的信噪比较低和低对比度。为此，我们首先通过移除 125 个未对齐的图像对来收集 715 个白天图像对和 729 个夜间图像对。此外，利用基于暗通道先验的图像增强算法来优化红外图像的对比度和信噪比。因此，发布了新的多光谱道路场景（MSRS) 数据集包含 1,444 对对齐的高质量红外和可见图像。

下载地址

MSRS直链地址:https://github.com/Linfeng-Tang/MSRS/archive/refs/heads/main.zip

MFNet数据集：https://drive.google.com/drive/folders/1YtEMiUC8sC0iL9rONNv96n5jWuIsWrVY?usp=sharing

FLIR Thermal Starter 数据集

该数据集提供了带注释的热成像数据集和对应的无注释RGB图像，用于训练和验证神经网络。数据是由安装在车上的RGB相机和热成像相机获取的。

数据集总共包含14452张红外图像，其中10228张来自多个短视频；4224张来自一个长为144s的视频。所有视频都来自街道和高速路。大多数图片的采样率为1秒两帧，其中视频的帧率为1秒30帧；少数环境中目标较少时，采样率为1秒1帧。

下载地址：https://pan.baidu.com/s/11GJe4MdM_NH6fuENCQ2MtQ 提取码:019b

官方网站：https://www.flir.com/oem/adas/adas-dataset-form/

KAIST行人数据集

KAIST行人数据集总共包括95328张图片，每张图片都包含RGB彩色图像和红外图像两个版本。总共包含103128个密集注释。数据集分别在白天和晚上捕获了包括校园、街道以及乡下的各种常规交通场景。图片大小为640×480。数据集总共分为12个文件夹set00-set11。前6个文件夹为训练集包含50187张图片，后6个文件夹为测试集包含45141张图片。

下载地址：https://github.com/SoonminHwang/rgbt-ped-detection/blob/master/data/README.md

OTCBVS 数据集

OTCBVS 数据集用于测试和评估一些新颖和先进的计算机视觉算法，它包括了多个子数据集，比如：热目标行人数据集、红外与可见光人脸数据集、自动驾驶数据集、红外与可见光行人数据集等。其中红外与可见光行人数据集拍摄于俄亥俄州立大学校园内繁忙的道路交叉口，包含了17 089 对红外与可见光图像对，图像大小为320×240。

下载地址

https://kings.blog.csdn.net/article/details/109052006

其他

https://blog.csdn.net/warningm_dm/article/details/120137977

Visible-Infrared Database

专为研究图像融合问题而设计的可见红外数据库，可用于红外线和可见光序列同步并配准，包含原始(未同步和未对齐）、已同步且未对齐、对齐的三类图像对，Camouflage[伪装]、Lab: Indoor、Patio: Outdoor、Guanabara Bay: Outdoor、Hangar[机库]、Trees6个场景。

下载地址

https://www02.smt.ufrj.br/~fusion/

Citation

我们的总结参考了仓库(https://github.com/Linfeng-Tang/Image-Fusion):

lovepreeminence/Image-Fusion

Image Fusion

多模态图像融合(Multi-Modal Image Fusion)

红外和可见光图像融合(Infrared and visible image fusion)

Datasets

M3FD数据集

LLVIP数据集

IRVI数据集

COCO数据集

TNO数据集

INO数据集

RoadScene数据集

MSRS数据集

FLIR Thermal Starter 数据集

KAIST行人数据集

OTCBVS 数据集

其他

Citation