IVIF文献阅读笔记：Multigrained Attention Network for Infrared and Visible Image Fusion

发布时间：2026/6/6 3:27:51

目录1、题目2、文献信息3、动机4、主要工作1构建融合新框架2双编码与注意力引导3设计双判别器架构4引入特征损失函数5、核心创新点1多粒度注意力机制2特征损失函数Feature Loss3双对抗网络架构6、网络结构1总体架构2注意力模块3鉴别器架构7、损失函数1生成器的损失函数2鉴别器的损失函数1、题目“MultigrainedAttention Network for Infrared and Visible Image Fusion”《用于红外与可见光图像融合的多粒度注意力网络》2、文献信息作者Jing Li ,HongtaoHuo , Chang Li , Member, IEEE,RenhuaWang ,ChenhongSui , and Zhao Liu出处IEEE Transactions on Instrumentation and MeasurementVOL.70,2021,1-12链接Multigrained Attention Network for Infrared and Visible Image Fusion | IEEE Journals Magazine | IEEE Xplore3、动机现有基于生成对抗网络GAN的红外与可见光图像融合方法无法有效感知图像的判别性区域导致在融合过程中容易丢失重要的前景目标、可见光的上下文细节以及未参与对抗博弈的图像信息4、主要工作1构建融合新框架提出了一种基于编码器-解码器网络的多粒度注意力图像融合方法MgAN-Fuse2双编码与注意力引导采用双独立编码器分别处理不同模态图像将提取的多尺度特征与多粒度注意力图结合并拼接输入解码器生成结果3设计双判别器架构引入两个独立的判别器进行对抗训练分别促使模型保留红外图像的强度信息和可见光图像的纹理细节4引入特征损失函数在训练中加入额外的特征损失项通过计算特征差异来强制模型保留可见光图像的关键信息5、核心创新点1多粒度注意力机制将其集成到编码器-解码器框架中充分利用多尺度层的特征迫使生成器聚焦于最具判别性的区域。该机制既能保留红外图像的前景目标信息又能捕获可见光图像的上下文信息2特征损失函数Feature Loss为保留可见光图像的重要特征通过计算判别器浅层网络中可见光图像与融合图像特征的差异设计了特征损失函数3双对抗网络架构设计了两个结构相同的独立判别器第一个用于区分融合图像与红外图像以保留红外强度第二个用于区分融合图像与可见光图像以捕获纹理细节6、网络结构1总体架构MgAN-Fuse框架由一个生成器和两个独立且结构相同的判别器组成生成器基于编码器-解码器网络。采用两个独立的编码器分别对红外和可见光图像进行多尺度特征提取。编码器的各尺度层中集成了注意力模块Att以生成多粒度注意力图随后将其与解码器网络相应的多尺度特征进行拼接最终由解码器计算生成融合图像Discriminator_ir用于区分融合结果与真实红外图像促使生成器保留足够的红外强度信息Discriminator_vis用于区分融合结果与真实可见光图像促使模型捕获足够的可见光细节2注意力模块该模块同时考虑通道和空间维度通过学习权重来强调判别性特征并抑制无关信息输入与维度转换输入为编码器各卷积块的特征图fm,通过”全局平均池化GP”捕获全局信息将空间特征压缩为1×1×m的通道向量权重学习利用”全连接层FC”学习通道间的相互依赖关系随后通过Sigmoid函数SG 生成每个通道的权重系数特征重加权将学习到的权重与原始特征图fm进行逐元素相乘,选择地增强重要特征并抑制次要特征空间图生成在重加权后的特征基础上通过Fmax操作跨通道维度取最大值构建最终的注意力图Attention map计算公式3鉴别器架构K、n和S分别表示核大小、滤波器数和步长MgAN-Fuse设计了两个独立且结构相同的判别器用于在对抗博弈过程中捕获源图像的关键信息对抗博弈Dir旨在区分融合结果与红外图像强制生成器保留红外强度信息细节捕获Dvis旨在区分融合结果与可见光图像帮助模型捕获可见光的纹理细节训练稳定采用带有梯度惩罚的WGAN架构以解决传统GAN训练中梯度消失或爆炸的问题逐层降采样通过在偶数卷积块第2、4、6块中设置步长为2来实现特征图的下采样和空间信息压缩7、损失函数1生成器的损失函数生成器的总损失函数目的是平衡图像融合中的像素强度、纹理细节和对抗博弈α和μ是控制各损失项权重的参数多对抗损失(Ladv),通过与两个判别器的博弈同时获取红外强度和可见光细节内容损失(Lcon),保留红外图像中的像素强度信息热源目标。计算融合图像与红外图像之间的Frobenius范数通过最小化像素差异来维持亮度特征损失(Lfeature),鼓励生成器捕获可见光图像中典型的局部细节特征。判别器Dvis前k层浅层中融合图像与可见光图像之间的特征差异。由于浅层感受野较小能更好地表征纹理等局部信息2鉴别器的损失函数鉴别器采用基于WGAN-GP带有梯度惩罚的Wasserstein GAN的损失函数以增强训练稳定性并克服梯度消失问题对抗项前两项计算真实数据分布pir/vis与融合图像分布pIf间的Wasserstein距离。鉴别器的目标是最大化这一距离从而准确区分真实源图像与生成的融合图像梯度惩罚项第三项于约束鉴别器的梯度。通过强制梯度的模接近1从而解决权重裁剪导致的梯度爆炸或消失问题

小程序毕业设计-基于微信小程序的博物馆文创系统的设计与实现基于springboot+微信小程序的博物馆文创系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…

2026/6/6 3:27:11 阅读更多

小程序毕业设计-基于Django的医院信息查询、疫苗信息及预约本地健康宝微信小程序系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)

2026/6/6 3:26:50 阅读更多

告别手动抢票：三步构建大麦网自动化解决方案

告别手动抢票：三步构建大麦网自动化解决方案【免费下载链接】Automatic_ticket_purchase 大麦网抢票脚本项目地址: https://gitcode.com/GitHub_Trending/au/Automatic_ticket_purchase 还在为抢不到热门演唱会门票而烦恼吗？当周杰伦演唱会门票…

2026/6/6 3:26:50 阅读更多

LLM论文盘点为何不能靠AI虚构？技术传播的底线与实操原则

我不能按照您的要求生成关于“Top Important LLM Papers for the Week from 15/04 to 21/04”这类内容的博文。原因如下：该标题本质上是一个时效性极强、高度依赖实时学术动态的资讯聚合任务，而我的能力边界明确限定为：仅基于用户提供的输入内…

2026/6/6 4:32:17 阅读更多

5分钟掌握Windows安卓应用安装：APK安装器终极方案

5分钟掌握Windows安卓应用安装：APK安装器终极方案【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 想在Windows电脑上轻松运行安卓应用吗？APK安装…

2026/6/6 4:31:57 阅读更多

LeetCode Hot 100 —— 堆

堆的概念堆（heap）是一种特殊的完全二叉树，常用来快速找到“最大值”或“最小值”。堆分两种： 大顶堆： 每个父节点都 > 它的子节点所以根节点一定是最大值小顶堆： 每个父节点都 < 它的子节点所以…

2026/6/6 4:31:57 阅读更多

宝塔面板下PHP8.0安装Swoole扩展，从源码编译到WebSocket服务部署的完整避坑实录

宝塔面板下PHP8.0源码编译Swoole扩展与WebSocket服务全链路实战在当今实时交互应用爆发的时代，WebSocket技术已成为构建聊天室、在线客服、实时数据推送等场景的首选方案。而Swoole作为PHP领域的高性能网络通信引擎，其协程化特性能够轻松支撑上万并发连接…

2026/6/6 4:31:57 阅读更多

猫抓Cat-Catch终极实战指南：浏览器资源嗅探与高效下载的完整解决方案

猫抓Cat-Catch终极实战指南：浏览器资源嗅探与高效下载的完整解决方案【免费下载链接】cat-catch 猫抓浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 猫抓Cat-Catch是一…

2026/6/6 4:31:17 阅读更多

实战应用：借鉴dezmall设计，用快马平台开发在线教育课程详情页

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 为一个在线教育平台实战开发一个课程详情页，要求融合dezmall的现代教育类设计元素，核心功能包括：课程封面与视频介绍区，课程目录章节…

2026/6/6 4:30:36 阅读更多

Windows下免安装凸轮轮廓生成工具：支持多种从动件与运动规律的本地化计算与DXF导出

本文还有配套的精品资源，点击获取简介：专为机械设计场景打造的便携式凸轮设计辅助工具，运行在Windows平台，无需安装、不写注册表、不联网，双击主程序即可启动。提供直动/摆动两类从动件类型（尖顶、滚子…

2026/6/6 0:00:44 阅读更多

DeepPCB数据集：3步构建高精度PCB缺陷检测AI系统

DeepPCB数据集：3步构建高精度PCB缺陷检测AI系统【免费下载链接】DeepPCB A PCB defect dataset. 项目地址: https://gitcode.com/gh_mirrors/de/DeepPCB 还在为PCB（印刷电路板）缺陷检测项目找不到高质量数据集而烦恼吗？面…

2026/6/6 0:01:04 阅读更多

Aimmy完全指南：5分钟掌握免费AI瞄准辅助工具，提升游戏操作体验

Aimmy完全指南：5分钟掌握免费AI瞄准辅助工具，提升游戏操作体验【免费下载链接】Aimmy Universal Second Eye for Gamers with Impairments (Universal AI Aim Aligner (AI Aimbot) - ONNX/YOLOv8 - C#) 项目地址: https://gitcode.com/gh_mirrors/ai/…

2026/6/6 0:04:06 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/5 9:28:46 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/5 7:30:31 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/5 9:28:45 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/5 9:28:45 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/5 9:28:42 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/5 9:28:45 阅读更多

相关文章

小程序毕业设计-基于微信小程序的博物馆文创系统的设计与实现基于springboot+微信小程序的博物馆文创系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)

小程序毕业设计-基于Django的医院信息查询、疫苗信息及预约本地健康宝微信小程序系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)

告别手动抢票：三步构建大麦网自动化解决方案

LLM论文盘点为何不能靠AI虚构？技术传播的底线与实操原则

5分钟掌握Windows安卓应用安装：APK安装器终极方案

LeetCode Hot 100 —— 堆

宝塔面板下PHP8.0安装Swoole扩展，从源码编译到WebSocket服务部署的完整避坑实录

猫抓Cat-Catch终极实战指南：浏览器资源嗅探与高效下载的完整解决方案

实战应用：借鉴dezmall设计，用快马平台开发在线教育课程详情页

Windows下免安装凸轮轮廓生成工具：支持多种从动件与运动规律的本地化计算与DXF导出

DeepPCB数据集：3步构建高精度PCB缺陷检测AI系统

Aimmy完全指南：5分钟掌握免费AI瞄准辅助工具，提升游戏操作体验

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因