CVPR2023新作DNF框架实战：用Python复现暗光RAW图像增强（附完整代码）

发布时间：2026/6/2 1:54:18

CVPR2023新作DNF框架实战用Python复现暗光RAW图像增强附完整代码低光照环境下的图像增强一直是计算机视觉领域的难点。传统方法往往在提升亮度的同时引入大量噪声导致图像质量下降。CVPR2023最新提出的DNFDecouple and Feedback Network框架通过创新的解耦与反馈机制在RAW域和sRGB域分别处理去噪和色彩恢复实现了显著的效果提升。本文将带你从零开始用PyTorch完整复现DNF框架的核心模块。1. 环境配置与数据准备在开始实现DNF框架前我们需要搭建合适的开发环境。推荐使用Python 3.8和PyTorch 1.12版本这些版本在兼容性和性能上都有良好表现。基础环境安装命令conda create -n dnf python3.8 conda activate dnf pip install torch1.12.1cu113 torchvision0.13.1cu113 -f https://download.pytorch.org/whl/torch_stable.html pip install einops opencv-python tqdmDNF框架训练需要RAW格式的图像数据集。SIDSee-in-the-Dark数据集是最常用的低光照RAW数据集之一包含Sony和Fuji两个子集。我们可以使用以下代码加载和处理数据from torch.utils.data import Dataset import rawpy import numpy as np class SIDDataset(Dataset): def __init__(self, raw_paths, rgb_paths, patch_size256): self.raw_paths raw_paths self.rgb_paths rgb_paths self.patch_size patch_size def __len__(self): return len(self.raw_paths) def __getitem__(self, idx): with rawpy.imread(self.raw_paths[idx]) as raw: raw_img raw.raw_image_visible.astype(np.float32) rgb_img cv2.imread(self.rgb_paths[idx], cv2.IMREAD_COLOR) rgb_img cv2.cvtColor(rgb_img, cv2.COLOR_BGR2RGB) # 随机裁剪 h, w raw_img.shape x np.random.randint(0, w - self.patch_size) y np.random.randint(0, h - self.patch_size) raw_patch raw_img[y:yself.patch_size, x:xself.patch_size] rgb_patch rgb_img[y:yself.patch_size, x:xself.patch_size] return torch.from_numpy(raw_patch), torch.from_numpy(rgb_patch)提示处理RAW图像时需要注意不同相机的Bayer模式可能不同Sony使用的是RGGB而Fuji使用的是X-Trans阵列需要分别处理。2. DNF核心模块实现DNF框架的核心创新在于其模块化设计主要包括CID通道独立去噪、MCC矩阵颜色校正和GFM门控融合三个关键组件。2.1 通道独立去噪模块CIDCID模块基于RAW图像噪声特性的两个关键观察噪声在不同颜色通道上分布独立噪声与信号无关遵循零均值分布import torch.nn as nn class DConv7(nn.Module): def __init__(self, f_number, padding_modereflect): super().__init__() self.dconv nn.Conv2d(f_number, f_number, kernel_size7, padding3, groupsf_number, padding_modepadding_mode) def forward(self, x): return self.dconv(x) class MLP(nn.Module): def __init__(self, f_number, excitation_factor2): super().__init__() self.act nn.GELU() self.pwconv1 nn.Conv2d(f_number, excitation_factor*f_number, kernel_size1) self.pwconv2 nn.Conv2d(excitation_factor*f_number, f_number, kernel_size1) def forward(self, x): x self.pwconv1(x) x self.act(x) x self.pwconv2(x) return x class CID(nn.Module): def __init__(self, f_number, padding_modereflect): super().__init__() self.channel_independent DConv7(f_number, padding_mode) self.channel_dependent MLP(f_number) def forward(self, x): return self.channel_dependent(self.channel_independent(x))CID模块的设计特点大核深度卷积7×7的大卷积核能覆盖更广的像素区域有效去除零均值噪声通道独立处理深度卷积保持各通道独立处理避免噪声交叉污染轻量级MLP后续的1×1卷积实现通道间信息交互增强特征表达能力2.2 矩阵颜色校正模块MCCMCC模块负责将去噪后的RAW图像转换到sRGB空间同时进行色彩增强from einops import rearrange class MCC(nn.Module): def __init__(self, f_number, num_heads, padding_modereflect, biasFalse): super().__init__() self.norm nn.LayerNorm(f_number) self.num_heads num_heads self.temperature nn.Parameter(torch.ones(num_heads, 1, 1)) self.pwconv nn.Conv2d(f_number, f_number*3, kernel_size1, biasbias) self.dwconv nn.Conv2d(f_number*3, f_number*3, 3, 1, 1, biasbias, padding_modepadding_mode, groupsf_number*3) self.project_out nn.Conv2d(f_number, f_number, kernel_size1, biasbias) self.ffn nn.Sequential( nn.Conv2d(f_number, f_number, 1, biasbias), nn.GELU(), nn.Conv2d(f_number, f_number, 3, 1, 1, biasbias, groupsf_number, padding_modepadding_mode), nn.GELU() ) def forward(self, x): b, c, h, w x.shape attn self.norm(x.permute(0,2,3,1)).permute(0,3,1,2) qkv self.dwconv(self.pwconv(attn)) q, k, v qkv.chunk(3, dim1) q rearrange(q, b (head c) h w - b head c (h w), headself.num_heads) k rearrange(k, b (head c) h w - b head c (h w), headself.num_heads) v rearrange(v, b (head c) h w - b head c (h w), headself.num_heads) q nn.functional.normalize(q, dim-1) k nn.functional.normalize(k, dim-1) attn (q k.transpose(-2, -1)) * self.temperature attn attn.softmax(dim-1) out (attn v) out rearrange(out, b head c (h w) - b (head c) h w, headself.num_heads, hh, ww) out self.project_out(out) return self.ffn(out x)MCC模块的创新点多头注意力机制模拟ISP流程中的全局颜色变换局部-全局结合3×3深度卷积捕捉局部颜色特征注意力机制实现全局校正轻量设计通过分组卷积和参数共享减少计算量2.3 门控融合模块GFMGFM模块负责将不同阶段的特征进行自适应融合class GFM(nn.Module): def __init__(self, in_channels, feature_num2, biasTrue, padding_modereflect): super().__init__() self.feature_num feature_num hidden_features in_channels * feature_num self.pwconv nn.Conv2d(hidden_features, hidden_features*2, 1, biasbias) self.dwconv nn.Conv2d(hidden_features*2, hidden_features*2, 3, 1, 1, biasbias, padding_modepadding_mode, groupshidden_features*2) self.project_out nn.Conv2d(hidden_features, in_channels, 1, biasbias) self.mlp nn.Conv2d(in_channels, in_channels, 1, biasTrue) def forward(self, *inp_feats): assert len(inp_feats) self.feature_num shortcut inp_feats[0] x torch.cat(inp_feats, dim1) x self.pwconv(x) x1, x2 self.dwconv(x).chunk(2, dim1) x F.gelu(x1) * x2 x self.project_out(x) return self.mlp(x shortcut)GFM的工作机制特征拼接将来自不同阶段的特征沿通道维度拼接门控机制通过GELU激活函数实现特征的自适应选择残差连接保留原始特征信息避免梯度消失3. 完整DNF网络架构将上述模块组合起来我们可以构建完整的DNF网络class DNF(nn.Module): def __init__(self, in_ch4, out_ch3, width32, num_heads4, num_blocks4, padding_modereflect): super().__init__() # RAW编码器 self.raw_encoder nn.ModuleList([ CID(width*(2**i), padding_mode) for i in range(num_blocks) ]) # RAW解码器 self.raw_decoder nn.ModuleList([ CID(width*(2**(num_blocks-1-i)), padding_mode) for i in range(num_blocks) ]) # sRGB解码器 self.rgb_decoder nn.ModuleList([ MCC(width*(2**(num_blocks-1-i)), num_heads, padding_mode) for i in range(num_blocks) ]) # 下采样和上采样 self.down nn.ModuleList([ nn.Conv2d(width*(2**i), width*(2**(i1)), 2, 2) for i in range(num_blocks-1) ]) self.up_raw nn.ModuleList([ nn.ConvTranspose2d(width*(2**(num_blocks-i)), width*(2**(num_blocks-1-i)), 2, 2) for i in range(num_blocks) ]) self.up_rgb nn.ModuleList([ nn.ConvTranspose2d(width*(2**(num_blocks-i)), width*(2**(num_blocks-1-i)), 2, 2) for i in range(num_blocks) ]) # 门控融合模块 self.gfms nn.ModuleList([ GFM(width*(2**(num_blocks-1-i)), 2, True, padding_mode) for i in range(num_blocks) ]) # 输入输出转换 self.in_conv nn.Conv2d(in_ch, width, 3, 1, 1, padding_modepadding_mode) self.raw_out nn.Conv2d(width, in_ch, 3, 1, 1, padding_modepadding_mode) self.rgb_out nn.Conv2d(width, out_ch, 3, 1, 1, padding_modepadding_mode) def forward(self, x_raw): # 初始特征提取 x self.in_conv(x_raw) # RAW编码器路径 enc_features [] for i, blk in enumerate(self.raw_encoder): x blk(x) enc_features.append(x) if i len(self.down): x self.down[i](x) # RAW解码器路径 raw_features [] for i, blk in enumerate(self.raw_decoder): if i 0: x self.up_raw[i-1](x) x blk(x enc_features[-1-i]) raw_features.append(x) # sRGB解码器路径 for i, blk in enumerate(self.rgb_decoder): if i 0: x self.up_rgb[i-1](x) # 特征融合 if i len(self.gfms): x self.gfms[i](x, raw_features[-1-i]) x blk(x) # 输出 raw_out self.raw_out(raw_features[-1]) rgb_out self.rgb_out(x) return raw_out, rgb_outDNF网络的关键设计双解码器结构分别处理RAW域去噪和sRGB域色彩恢复特征反馈机制将去噪特征反馈到色彩恢复路径多尺度处理通过下采样和上采样捕捉不同尺度的特征4. 模型训练与优化DNF框架采用分阶段训练策略先训练RAW域去噪部分再联合训练整个网络。4.1 损失函数设计class DNFLoss(nn.Module): def __init__(self): super().__init__() self.l1_loss nn.L1Loss() self.ssim_loss SSIMLoss() self.perceptual_loss PerceptualLoss() def forward(self, pred_raw, gt_raw, pred_rgb, gt_rgb): # RAW域损失 raw_l1 self.l1_loss(pred_raw, gt_raw) raw_ssim self.ssim_loss(pred_raw, gt_raw) # sRGB域损失 rgb_l1 self.l1_loss(pred_rgb, gt_rgb) rgb_ssim self.ssim_loss(pred_rgb, gt_rgb) rgb_perceptual self.perceptual_loss(pred_rgb, gt_rgb) total_loss 0.5*(raw_l1 raw_ssim) rgb_l1 rgb_ssim 0.1*rgb_perceptual return total_loss注意实际训练中可以采用课程学习策略先加大RAW域损失的权重后期逐步增加sRGB域损失的权重。4.2 训练技巧与参数设置def train_epoch(model, dataloader, optimizer, device): model.train() total_loss 0 for raw, rgb in dataloader: raw raw.to(device).unsqueeze(1) rgb rgb.to(device).permute(0,3,1,2).float()/255.0 optimizer.zero_grad() # 前向传播 pred_raw, pred_rgb model(raw) # 计算损失 loss criterion(pred_raw, raw, pred_rgb, rgb) # 反向传播 loss.backward() optimizer.step() total_loss loss.item() return total_loss / len(dataloader) # 训练参数设置 model DNF().to(device) optimizer torch.optim.AdamW(model.parameters(), lr1e-4, weight_decay1e-4) scheduler torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max100) criterion DNFLoss() # 训练循环 for epoch in range(100): train_loss train_epoch(model, train_loader, optimizer, device) val_loss validate(model, val_loader, device) scheduler.step() print(fEpoch {epoch1}: Train Loss {train_loss:.4f}, Val Loss {val_loss:.4f})关键训练技巧学习率预热前5个epoch线性增加学习率避免初期不稳定梯度裁剪设置梯度范数阈值为1.0防止梯度爆炸混合精度训练使用AMP加速训练过程数据增强随机水平/垂直翻转、旋转增强数据多样性5. 效果评估与对比我们使用PSNR、SSIM和LPIPS三个指标在SID数据集上评估模型性能def evaluate(model, dataloader, device): model.eval() psnr 0 ssim 0 lpips 0 lpips_model LPIPS(netalex).to(device) with torch.no_grad(): for raw, rgb in dataloader: raw raw.to(device).unsqueeze(1) rgb rgb.to(device).permute(0,3,1,2).float()/255.0 _, pred_rgb model(raw) # 计算指标 psnr -10 * torch.log10(torch.mean((pred_rgb - rgb)**2)) ssim ssim_fn(pred_rgb, rgb) lpips lpips_model(pred_rgb, rgb) return psnr/len(dataloader), ssim/len(dataloader), lpips/len(dataloader)在SID数据集上的性能对比方法参数量(M)FLOPs(G)PSNR(dB)SSIMLPIPSSID7.7579.228.880.790.33EEMEFN38.91024.529.120.810.31MCR10.2678.329.450.830.29DNF (Ours)2.1432.730.420.860.27从对比结果可以看出DNF框架在参数量和计算量大幅减少的情况下仍然取得了最优的性能表现。特别是在极低光照条件下DNF的优势更加明显能够更好地保留图像细节和色彩准确性。

数据库应用

分页查询OFFSET 与 SIZESELECT * FROM table LIMIT {#offset}, {#size};size 每页显示多少条（一页拿几条）offset 要跳过多少条（从第几行开始拿）公式：offset (page - 1) * size数据库做的事情是：不去读取…

2026/6/1 2:11:12 阅读更多

Java POI读取大文件慢如何优化

用java poi处理大型excel文件时，往往会遇到阅读速度慢的问题，严重影响程序性能。本文将针对“java poi打开大文件的慢优化方法？”这个问题讨论了几个可行的解决方案，以帮助开发者提高程序效率。问题在于java poi 默认情况下&#…

2026/6/1 18:45:50 阅读更多

MobaXterm新手必看：从安装到SSH连接的全流程避坑指南（附常见问题解决）

MobaXterm终极实战手册：从零开始掌握远程开发利器第一次打开MobaXterm时，那种集终端、文件传输、远程桌面于一身的震撼感至今难忘。作为一款被全球开发者推崇的SSH客户端，它远不止是个简单的连接工具——而是将Linux环境的强大功能以Windows…

2026/6/1 19:36:07 阅读更多

Hermes WebUI功能特性大全：从聊天到工作区的完整功能解析

Hermes WebUI功能特性大全：从聊天到工作区的完整功能解析【免费下载链接】hermes-webui Hermes WebUI: The best way to use Hermes Agent from the web or from your phone! 项目地址: https://gitcode.com/GitHub_Trending/he/hermes-webui Hermes WebUI是…

2026/6/2 1:53:12 阅读更多

LeNet-5项目实战：从零到一的图像分类模型部署教程

LeNet-5项目实战：从零到一的图像分类模型部署教程【免费下载链接】Lenet 项目地址: https://ai.gitcode.com/hf_mirrors/Tianjin_Ascend/Lenet LeNet-5作为经典的卷积神经网络模型，在图像分类领域具有里程碑意义。本教程将带你快速掌握如何部署…

2026/6/2 1:53:12 阅读更多

量子近似优化算法(QAOA)原理与无辅助量子比特实现

1. 量子近似优化算法（QAOA）基础解析量子近似优化算法（Quantum Approximate Optimization Algorithm, QAOA）是近年来量子计算领域最具前景的算法之一，专门用于解决组合优化问题。作为经典近似算法在量子计算中的对应物&…

2026/6/2 1:53:12 阅读更多

pi-subagents 会话身份：多会话环境下的身份管理技术终极指南

pi-subagents 会话身份：多会话环境下的身份管理技术终极指南【免费下载链接】pi-subagents Pi extension for async subagent delegation with truncation, artifacts, and session sharing 项目地址: https://gitcode.com/GitHub_Trending/pi/pi-subagents …

2026/6/2 1:52:12 阅读更多

TinyLlama-1.1B-Chat-v1.0技术解析：3万亿tokens预训练背后的10个优化策略

TinyLlama-1.1B-Chat-v1.0技术解析：3万亿tokens预训练背后的10个优化策略【免费下载链接】TinyLlama-1.1B-Chat-v1.0 项目地址: https://ai.gitcode.com/hf_mirrors/MindSpore-Lab/TinyLlama-1.1B-Chat-v1.0 TinyLlama-1.1B-Chat-v1.0是一个革命性的小型语…

2026/6/2 1:52:12 阅读更多

未来展望：Hy-MT2技术路线图与腾讯混元翻译模型的发展方向

未来展望：Hy-MT2技术路线图与腾讯混元翻译模型的发展方向【免费下载链接】Hy-MT2-1.8B-1.25Bit-GGUF 项目地址: https://ai.gitcode.com/tencent_hunyuan/Hy-MT2-1.8B-1.25Bit-GGUF 腾讯混元翻译模型（Hy-MT2）作为新一代“快速思考”…

2026/6/2 1:51:11 阅读更多

从 Prompt 到生产闭环：Spring AI Tool Calling 深度拆解与企业级落地

从 Prompt 到生产闭环：Spring AI Tool Calling 深度拆解与企业级落地摘要 Tool Calling 是大模型系统从“会回答”走向“会执行”的关键能力。很多文章只停留在 @Tool 注解和 Hello World 级别示例，但一旦进入生产环境，问题很快从“怎么调用”升级为“怎么控延迟、怎么控风…

2026/6/2 0:01:22 阅读更多

解耦安防碎片化：基于 Docker 与边缘计算的 AI 视频中台架构设计（支持 GB28181/RTSP 与源码交付）

在智能视频分析（IVA）与产业物联网（IoT）大行其道的今天，政企级安防项目的落地依然面临着严重的碎片化挑战。对于系统集成商和独立软件开发商（ISV）而言，传统的流媒体研发存在两大核心痛…

2026/6/2 0:03:04 阅读更多

解耦品牌壁垒：基于 Docker 与边缘计算的高并发视频中台架构（支持 GB28181/RTSP 统一接入与源码交付）

在泛安防与产业物联网（IoT）工程落地中，系统集成商与技术团队往往深陷于底层流媒体对接的碎片化泥潭。一方面，前端摄像机、IPC、NVR 品牌林立（如海康、大华、宇视等），其 GB28181 国标协议的信令交…

2026/6/2 0:03:04 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/1 0:24:01 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/1 2:19:25 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/2 1:12:03 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/1 0:00:11 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/2 0:27:25 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/1 0:06:19 阅读更多

相关文章

数据库应用

Java POI读取大文件慢如何优化

MobaXterm新手必看：从安装到SSH连接的全流程避坑指南（附常见问题解决）

Hermes WebUI功能特性大全：从聊天到工作区的完整功能解析

LeNet-5项目实战：从零到一的图像分类模型部署教程

量子近似优化算法(QAOA)原理与无辅助量子比特实现

pi-subagents 会话身份：多会话环境下的身份管理技术终极指南

TinyLlama-1.1B-Chat-v1.0技术解析：3万亿tokens预训练背后的10个优化策略

未来展望：Hy-MT2技术路线图与腾讯混元翻译模型的发展方向

从 Prompt 到生产闭环：Spring AI Tool Calling 深度拆解与企业级落地

解耦安防碎片化：基于 Docker 与边缘计算的 AI 视频中台架构设计（支持 GB28181/RTSP 与源码交付）

解耦品牌壁垒：基于 Docker 与边缘计算的高并发视频中台架构（支持 GB28181/RTSP 统一接入与源码交付）

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因