Windows 10/11 + Python 3.7 环境，手把手教你用PyTorch 0.4复现AOD-NET去雾算法

发布时间：2026/5/20 9:37:19

Windows 10/11 Python 3.7 环境PyTorch 0.4 复现 AOD-NET 去雾算法全流程指南在计算机视觉领域图像去雾算法一直是个热门研究方向。AOD-NET 作为经典的端到端去雾网络其简洁的架构和稳定的效果使其成为学习图像复原的绝佳案例。本文将带你在 Windows 系统下从零开始搭建 Python 3.7 和 PyTorch 0.4 环境完整复现 AOD-NET 论文效果。1. 环境准备搭建专属的 Python 3.7 沙盒复现老版本算法最大的挑战往往来自环境依赖。PyTorch 0.4 发布于 2018 年与最新版本存在诸多不兼容。我们选择 Anaconda 创建隔离环境避免污染系统 Python。首先下载并安装 Anaconda3 2020.02 版本对应 Python 3.7然后执行conda create -n aodnet python3.7 conda activate aodnet接下来安装 PyTorch 0.4.1 和配套的 torchvision。由于官方源已移除了旧版本我们需要指定镜像源pip install torch0.4.1 -f https://download.pytorch.org/whl/cu80/torch_stable.html pip install torchvision0.2.1注意若使用 NVIDIA 显卡请确保 CUDA 8.0 和 cuDNN 7.0 已正确安装。Windows 下环境变量配置常是导致问题的元凶可通过nvcc --version验证。验证安装是否成功import torch print(torch.__version__) # 应输出 0.4.1 print(torch.cuda.is_available()) # 应返回 True如有GPU常见问题排查DLL 加载失败通常是 CUDA 路径未加入系统 PATH检查环境变量版本冲突彻底删除原有 PyTorch 再重装GPU 不可用降级显卡驱动或升级 CUDA 工具包2. 代码获取与结构调整AOD-NET 的官方实现通常需要从 GitHub 获取。我们以经典的 pytorch-AODNet 为例git clone https://github.com/MayankSingal/pytorch-AODNet.git cd pytorch-AODNet原始代码结构通常包含├── data/ # 空目录需自行添加数据集 ├── models/ # 网络定义 │ └── AOD_net.py ├── utils/ # 数据加载和工具函数 │ ├── dataloader.py │ └── utils.py ├── dehaze.py # 主训练脚本 └── test.py # 测试脚本需要重点修改的几个文件dataloader.pyWindows 路径处理# 修改路径拼接方式原始代码为Linux风格 # 原代码hazy_path os.path.join(data_path, hazy, img_list[i]) hazy_path os.path.join(data_path, hazy, img_list[i]).replace(/, \\)dehaze.py适配现代显卡# 在模型定义后添加 if torch.cuda.device_count() 1: net nn.DataParallel(net) net.cuda()AOD_net.py修复 PyTorch 0.4 的语法差异# 修改所有 .data[0] 为 .item() # 原代码loss.data[0] loss.item()3. 数据集准备与预处理理想情况下应使用论文原配的 RESIDE 数据集但其官网访问可能不稳定。这里提供两种替代方案方案A使用 NYU-Depth 子集从 MIT 开放数据下载精简版使用以下脚本生成合成雾图import cv2 import numpy as np def add_haze(img, beta0.1): beta 控制雾浓度 height, width img.shape[:2] A 0.9 # 大气光 size np.sqrt(height**2 width**2) center (width//2, height//2) # 生成深度图模拟 x np.arange(width) - center[0] y np.arange(height) - center[1] xx, yy np.meshgrid(x, y) d_map np.sqrt(xx**2 yy**2) / size # 合成雾图 transmission np.exp(-beta * d_map) haze img * transmission[..., np.newaxis] A * (1 - transmission[..., np.newaxis]) return np.clip(haze, 0, 255).astype(np.uint8)方案B下载预处理好的 Haze4K直接从 Kaggle 下载已配对的清晰-雾图数据集解压到data/目录。数据集目录应最终组织为data/ ├── clear/ # 清晰图像 │ ├── 1.png │ └── ... └── hazy/ # 对应雾图 ├── 1.png └── ...提示小规模实验可使用 256x256 的裁剪 patches大幅减少训练时间而不显著影响效果。4. 训练过程详解与调优配置文件修改建议dehaze.py中parser.add_argument(--batch_size, typeint, default16) # 根据显存调整 parser.add_argument(--epochs, typeint, default50) parser.add_argument(--lr, typefloat, default0.001) parser.add_argument(--beta, typefloat, default0.04) # 雾浓度参数启动训练python dehaze.py --data_path ./data --save_path ./results训练过程中的关键监控点损失曲线正常应在前 5 epoch 快速下降之后平缓显存占用通过nvidia-smi观察调整 batch_size 避免 OOM中间结果每 5 epoch 保存的测试样本常见问题解决方案问题现象可能原因解决方法Loss 不下降学习率过高/低尝试 0.01~0.0001 范围输出全灰梯度爆炸添加梯度裁剪nn.utils.clip_grad_norm_CUDA 错误张量未转移至GPU检查.cuda()调用位置学习率调度策略改进# 在训练循环中添加 scheduler torch.optim.lr_scheduler.ReduceLROnPlateau( optimizer, modemin, factor0.5, patience3, verboseTrue) for epoch in range(epochs): train(...) val_loss validate(...) scheduler.step(val_loss) # 动态调整学习率5. 测试与效果评估训练完成后使用测试脚本评估模型python test.py --model_path ./results/net_epoch50.pth --test_dir ./demo_images定量评估指标需准备 ground truthfrom skimage.metrics import peak_signal_noise_ratio as psnr from skimage.metrics import structural_similarity as ssim def evaluate(clear, dehazed): psnr_val psnr(clear, dehazed, data_range255) ssim_val ssim(clear, dehazed, multichannelTrue, data_range255) return psnr_val, ssim_val典型结果对比NYU-Depth 测试集方法PSNR ↑SSIM ↑推理时间 (ms) ↓原雾图15.20.62-AOD-NET22.70.8345DCP18.30.71120实际应用技巧对于视频流处理可固定模型参数避免重复加载边缘设备部署时考虑转换为 ONNX 格式真实场景图像可能需要微调 beta 参数6. 进阶优化方向当基础版本跑通后可以考虑以下改进网络结构微调# 在 AOD_net.py 中尝试加深网络 self.conv4 nn.Sequential( nn.Conv2d(32, 32, kernel_size3, padding1), nn.ReLU(), nn.BatchNorm2d(32) # 添加BN层 )数据增强策略from torchvision import transforms train_transform transforms.Compose([ transforms.RandomHorizontalFlip(), transforms.ColorJitter(0.1, 0.1, 0.1), transforms.ToTensor() ])混合精度训练需安装 apexfrom apex import amp model, optimizer amp.initialize(net, optimizer, opt_levelO1) with amp.scale_loss(loss, optimizer) as scaled_loss: scaled_loss.backward()在 RTX 3060 显卡上的训练速度对比模式Batch16Batch32显存占用FP321.2 it/sOOM8.2GBAMP2.1 it/s1.8 it/s5.1GB最后分享一个实用技巧当处理高分辨率图像时可以先将图像分块处理再拼接避免显存不足。我在处理 4K 图像时使用 512x512 的滑动窗口重叠 64 像素最后通过加权融合消除接缝

高数函数定义域避坑指南：从‘x不能为零’到抽象函数，手把手教你识别题目陷阱

高数函数定义域避坑指南：从‘x不能为零’到抽象函数，手把手教你识别题目陷阱考前冲刺阶段，函数定义域问题往往是高数考试中的"隐形杀手"。许多学生明明掌握了复杂计算技巧，却在基础定义域判断上频频失分。本文将直击五…

2026/5/20 9:36:37 阅读更多

Desktop Postflop：免费开源的德州扑克GTO求解器完整指南

Desktop Postflop：免费开源的德州扑克GTO求解器完整指南【免费下载链接】desktop-postflop [Development suspended] Advanced open-source Texas Holdem GTO solver with optimized performance 项目地址: https://gitcode.com/gh_mirrors/de/desktop-postflop …

2026/5/20 9:36:37 阅读更多

Unraid SMB共享权限设置详解：从‘公开’到‘私有’，如何为家人和项目分配不同访问权限？

Unraid SMB共享权限精细化管理实战：打造家庭与团队协作的安全文件中心在数字化生活与协作日益普及的今天，家庭媒体中心和小型团队项目文件库已成为许多技术爱好者和专业人士的刚需。Unraid作为一款备受推崇的NAS操作系统，其SMB共享功能让文件…

2026/5/20 9:35:36 阅读更多

3步搞定重复图片清理：AntiDupl.NET开源工具的终极方案

3步搞定重复图片清理：AntiDupl.NET开源工具的终极方案【免费下载链接】AntiDupl A program to search similar and defect pictures on the disk 项目地址: https://gitcode.com/gh_mirrors/an/AntiDupl 你是否曾经历过这样的场景？电脑硬盘空间莫…

2026/5/20 12:09:19 阅读更多

手把手教你用ROS小车仿真环境搞定LIO-SAM建图与NDT定位（附避坑指南）

从零构建ROS仿真环境：LIO-SAM建图与NDT定位全流程实战解析在自动驾驶与机器人导航领域，激光SLAM技术已成为环境感知的核心支柱。当新手开发者首次接触ROS和SLAM时，往往会被复杂的坐标系转换、参数配置和实时调试所困扰。本文将基于steer_min…

2026/5/20 12:08:57 阅读更多

突破限制：5步解锁VMware的macOS虚拟机隐藏功能

突破限制：5步解锁VMware的macOS虚拟机隐藏功能【免费下载链接】unlocker VMware macOS utilities 项目地址: https://gitcode.com/gh_mirrors/unl/unlocker VMware Unlocker是一款革命性的开源工具，专为在非苹果硬件上运行macOS虚拟机而设计。通…

2026/5/20 12:08:16 阅读更多

Avogadro 2：如何免费实现专业级3D分子建模与可视化？

Avogadro 2：如何免费实现专业级3D分子建模与可视化？ 【免费下载链接】avogadroapp Avogadro is an advanced molecular editor designed for cross-platform use in computational chemistry, molecular modeling, bioinformatics, materials science, a…

2026/5/20 12:08:16 阅读更多

FFmpeg Batch AV Converter 实战手册：告别命令行，批量视频处理新体验

FFmpeg Batch AV Converter 实战手册：告别命令行，批量视频处理新体验【免费下载链接】ffmpeg_batch FFmpeg Batch AV Converter 项目地址: https://gitcode.com/gh_mirrors/ff/ffmpeg_batch 还在为FFmpeg复杂的命令行参数头疼吗？面对…

2026/5/20 12:07:56 阅读更多

LevelUI实战指南：构建高效的LevelDB可视化管理系统

LevelUI实战指南：构建高效的LevelDB可视化管理系统【免费下载链接】levelui A GUI for LevelDB management based on atom-shell. 项目地址: https://gitcode.com/gh_mirrors/le/levelui LevelUI是一款基于Electron框架开发的LevelDB数据库图形化管理工具&a…

2026/5/20 12:07:56 阅读更多

顶伯在线语音工具背后的技术力量：AI语音合成与深度学习解析

顶伯在线语音工具背后的技术力量在人工智能浪潮中，语音交互正成为人机沟通的核心方式。顶伯作为行业领先的在线语音工具，凭借自主研发的深度学习架构，将文字转化为高度自然的语音，广泛应用于有声阅读、智能客服、教育辅助等领域。…

2026/5/20 0:00:25 阅读更多

全志V3s开发板实战：用Buildroot 2020.02.4定制你的第一个最小Linux文件系统

全志V3s开发板实战：用Buildroot 2020.02.4定制最小Linux文件系统在嵌入式开发领域，构建一个精简高效的Linux文件系统往往是项目成功的关键第一步。全志V3s作为一款高性价比的ARM Cortex-A7芯片，搭配Buildroot这一经典构建工具，能…

2026/5/20 0:00:25 阅读更多

百考通：AI赋能期刊论文写作，智能生成优质内容

在学术研究领域，期刊论文的撰写是成果输出的关键环节，却也让众多科研工作者与学生倍感压力：选题迷茫、逻辑梳理困难、格式规范复杂、内容提炼耗时，严重拖慢了学术成果的发表节奏。百考通（https://www.baikaotongai.com…

2026/5/20 0:00:46 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/20 5:14:40 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/19 6:17:20 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/20 2:02:06 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/20 5:46:58 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/20 3:00:53 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/19 22:33:20 阅读更多

相关文章