ResNet34实战：用自定义数据集（比如猫狗分类）快速验证你的模型是否真的有效

发布时间：2026/6/10 19:22:06

ResNet34实战从零构建猫狗分类器的快速验证指南当我们需要验证一个深度学习模型的有效性时最直接的方式不是阅读论文而是动手实现它。ResNet34作为计算机视觉领域的经典网络其残差结构设计巧妙训练稳定非常适合作为入门者验证模型能力的起点。本文将带你用PyTorch框架在Kaggle猫狗数据集上快速搭建并验证ResNet34模型。1. 环境准备与数据加载在开始之前确保你的Python环境已安装PyTorch和Torchvision。如果你使用GPU加速训练还需要安装CUDA版本的PyTorchpip install torch torchvisionKaggle猫狗数据集包含25,000张图片其中12,500张猫和12,500张狗。我们可以使用Torchvision的ImageFolder自动加载这种结构化的数据集from torchvision import datasets, transforms data_transforms { train: transforms.Compose([ transforms.RandomResizedCrop(224), transforms.RandomHorizontalFlip(), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]), val: transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]), } image_datasets { x: datasets.ImageFolder(fdata/dogs-vs-cats/{x}, data_transforms[x]) for x in [train, val] } dataloaders { x: torch.utils.data.DataLoader( image_datasets[x], batch_size32, shuffleTrue, num_workers4) for x in [train, val] }提示数据增强是防止过拟合的有效手段RandomResizedCrop和RandomHorizontalFlip可以增加训练数据的多样性。2. ResNet34模型架构解析与调整ResNet34的核心在于残差块(Residual Block)的设计它通过shortcut连接解决了深层网络梯度消失的问题。标准的ResNet34是为ImageNet的1000类分类设计的我们需要修改最后的全连接层以适应二分类任务import torch.nn as nn from torchvision import models model models.resnet34(pretrainedTrue) num_ftrs model.fc.in_features model.fc nn.Linear(num_ftrs, 2) # 修改为二分类输出 # 如果使用GPU device torch.device(cuda:0 if torch.cuda.is_available() else cpu) model model.to(device)模型的主要组件包括初始卷积层7x7卷积64个输出通道步长2最大池化层3x3池化窗口步长2四个残差块组分别包含3,4,6,3个残差块全局平均池化将特征图降维到1x1全连接层最终的分类器3. 训练策略与超参数设置训练深度学习模型需要精心设置超参数和学习率策略。以下是一个典型的训练配置import torch.optim as optim criterion nn.CrossEntropyLoss() optimizer optim.SGD(model.parameters(), lr0.001, momentum0.9) exp_lr_scheduler optim.lr_scheduler.StepLR(optimizer, step_size7, gamma0.1)训练过程中需要监控的关键指标指标说明理想范围训练损失模型在训练集上的误差应持续下降验证准确率模型在验证集上的分类准确率应逐步提高训练/验证差距过拟合程度的指示器差距不宜过大训练循环的基本结构如下def train_model(model, criterion, optimizer, scheduler, num_epochs25): for epoch in range(num_epochs): # 训练阶段 model.train() running_loss 0.0 for inputs, labels in dataloaders[train]: inputs inputs.to(device) labels labels.to(device) optimizer.zero_grad() outputs model(inputs) loss criterion(outputs, labels) loss.backward() optimizer.step() running_loss loss.item() * inputs.size(0) # 验证阶段 model.eval() val_loss 0.0 corrects 0 with torch.no_grad(): for inputs, labels in dataloaders[val]: inputs inputs.to(device) labels labels.to(device) outputs model(inputs) loss criterion(outputs, labels) val_loss loss.item() * inputs.size(0) _, preds torch.max(outputs, 1) corrects torch.sum(preds labels.data) epoch_loss running_loss / len(image_datasets[train]) epoch_val_loss val_loss / len(image_datasets[val]) epoch_acc corrects.double() / len(image_datasets[val]) print(fEpoch {epoch}/{num_epochs-1}) print(fTrain Loss: {epoch_loss:.4f} Val Loss: {epoch_val_loss:.4f}) print(fVal Acc: {epoch_acc:.4f}) scheduler.step() return model4. 模型评估与可视化分析训练完成后我们需要评估模型的实际表现。混淆矩阵是分类任务中最直观的评估工具之一from sklearn.metrics import confusion_matrix import seaborn as sns import matplotlib.pyplot as plt def plot_confusion_matrix(model, dataloader): model.eval() all_preds [] all_labels [] with torch.no_grad(): for inputs, labels in dataloader: inputs inputs.to(device) labels labels.to(device) outputs model(inputs) _, preds torch.max(outputs, 1) all_preds.extend(preds.cpu().numpy()) all_labels.extend(labels.cpu().numpy()) cm confusion_matrix(all_labels, all_preds) plt.figure(figsize(8,6)) sns.heatmap(cm, annotTrue, fmtd, cmapBlues, xticklabels[Cat, Dog], yticklabels[Cat, Dog]) plt.xlabel(Predicted) plt.ylabel(Actual) plt.show() plot_confusion_matrix(model, dataloaders[val])注意良好的模型应该在混淆矩阵的对角线上有较高的数值而非对角线上的数值应尽可能小。除了整体准确率我们还应该关注以下指标精确率(Precision)预测为正类中实际为正类的比例召回率(Recall)实际为正类中被正确预测的比例F1分数精确率和召回率的调和平均这些指标可以通过sklearn轻松计算from sklearn.metrics import classification_report print(classification_report(all_labels, all_preds, target_names[Cat, Dog]))5. 模型优化与调参技巧当基础模型表现不佳时可以考虑以下优化策略学习率调整初始学习率太大可能导致震荡太小则收敛缓慢使用学习率调度器(如StepLR或ReduceLROnPlateau)动态调整正则化技术Dropout在全连接层前添加Dropout层权重衰减在优化器中设置weight_decay参数早停(Early Stopping)验证集性能不再提升时停止训练数据增强扩展train_transforms transforms.Compose([ transforms.RandomResizedCrop(224), transforms.RandomHorizontalFlip(), transforms.RandomRotation(20), transforms.ColorJitter(brightness0.2, contrast0.2, saturation0.2), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ])模型微调策略只训练最后几层冻结前面的卷积层仅训练全连接层分层学习率不同层使用不同的学习率渐进解冻逐步解冻更多层进行训练# 分层设置学习率示例 optimizer optim.SGD([ {params: model.conv1.parameters(), lr: 0.0001}, {params: model.layer1.parameters(), lr: 0.0005}, {params: model.layer2.parameters(), lr: 0.001}, {params: model.fc.parameters(), lr: 0.01} ], momentum0.9)6. 实际应用与模型部署训练好的模型可以保存下来供后续使用torch.save(model.state_dict(), resnet34_cat_dog.pth) # 加载模型 model models.resnet34(pretrainedFalse) model.fc nn.Linear(model.fc.in_features, 2) model.load_state_dict(torch.load(resnet34_cat_dog.pth)) model.eval()在实际应用中我们需要处理单张图片的预测from PIL import Image def predict_image(image_path): img Image.open(image_path) img data_transforms[val](img).unsqueeze(0) img img.to(device) with torch.no_grad(): output model(img) _, pred torch.max(output, 1) return Dog if pred.item() 1 else Cat # 测试单张图片 print(predict_image(test_cat.jpg))对于生产环境部署可以考虑以下方案TorchScript将模型转换为TorchScript格式提高推理效率ONNX转换为开放神经网络交换格式实现跨框架部署Flask/Django构建Web API服务移动端使用PyTorch Mobile部署到iOS/Android设备# 转换为TorchScript示例 example_input torch.rand(1, 3, 224, 224).to(device) traced_script_module torch.jit.trace(model, example_input) traced_script_module.save(resnet34_cat_dog_script.pt)在Kaggle猫狗数据集上的实践表明经过适当调参的ResNet34可以在验证集上达到约97%的准确率。这个过程中最重要的是理解模型每个组件的作用并通过实验验证各种技术对最终效果的影响。

Python 爬虫项目爬虫任务分组管理与批量启停

前言随着爬虫业务体量不断扩张，单脚本、单任务的运行模式已无法适配多站点、多品类、多区域的数据采集需求。实际生产环境中，往往需要同时维护数十甚至上百条爬虫任务，不同任务对应不同目标站点、采集规则、运行周期与资源配额。若依旧采用…

2026/6/10 19:20:45 阅读更多

话题锚定：信息时代最被忽视的阅读元能力

1. 这不是语法题，而是一场阅读理解的底层能力重建“What is the article’s topic means?”——看到这个句子，很多人的第一反应是：这明显有语病，应该是 “What does the article’s topic mean?” 才对。但我要说，停…

2026/6/10 19:17:18 阅读更多

全国县级边界+骨干河湖路网GIS矢量数据包（含属性与投影）

本文还有配套的精品资源，点击获取简介：一套开箱即用的全国地理空间基础数据，包含完整县级行政区划多边形、地级行政单位边界、长江黄河等主要河流线状分布、国家及省级公路主干网络、以及鄱阳湖洞庭湖等大型天然湖泊面状要素。所有图层均…

2026/6/10 19:17:18 阅读更多

如何使用T-LOAD：新手也能轻松上手的Termux界面改造指南

如何使用T-LOAD：新手也能轻松上手的Termux界面改造指南【免费下载链接】T-LOAD New Interface And Loading Screen For Termux Users 项目地址: https://gitcode.com/gh_mirrors/tl/T-LOAD T-LOAD是一款专为Termux用户设计的界面改造工具，能让你…

2026/6/10 20:41:13 阅读更多

VivienneVMM常见问题排查：解决安装和使用的10个难题

VivienneVMM常见问题排查：解决安装和使用的10个难题【免费下载链接】VivienneVMM VivienneVMM is a stealthy debugging framework implemented via an Intel VT-x hypervisor. 项目地址: https://gitcode.com/gh_mirrors/vi/VivienneVMM VivienneVMM 是一款…

2026/6/10 20:41:13 阅读更多

终极指南：用Python MarkItDown实现多格式文档智能转换的完整方案

终极指南：用Python MarkItDown实现多格式文档智能转换的完整方案【免费下载链接】markitdown Python tool for converting files and office documents to Markdown. 项目地址: https://gitcode.com/GitHub_Trending/ma/markitdown 还在为不同格式文档的数据…

2026/6/10 20:40:12 阅读更多

Heroku Buildpack for Elixir配置详解：轻松定制你的Elixir应用构建流程

Heroku Buildpack for Elixir配置详解：轻松定制你的Elixir应用构建流程【免费下载链接】heroku-buildpack-elixir Heroku Buildpack for Elixir with nitro boost 项目地址: https://gitcode.com/gh_mirrors/he/heroku-buildpack-elixir 想要在Heroku上部署…

2026/6/10 20:39:52 阅读更多

CAMEL多智能体框架：从零开始构建AI协作系统的完整指南

CAMEL多智能体框架：从零开始构建AI协作系统的完整指南【免费下载链接】camel 🐫 CAMEL: The first and the best multi-agent framework. Finding the Scaling Law of Agents. https://www.camel-ai.org 项目地址: https://gitcode.com/GitHub_Trendi…

2026/6/10 20:39:32 阅读更多

Bluetility安全指南：蓝牙设备调试的最佳实践

Bluetility安全指南：蓝牙设备调试的最佳实践【免费下载链接】Bluetility A Bluetooth Low Energy browser, an open-source alternative to LightBlue for OS X 项目地址: https://gitcode.com/gh_mirrors/bl/Bluetility 想要安全地进行蓝牙设备调试吗&…

2026/6/10 20:39:12 阅读更多

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析【免费下载链接】NomNom NomNom is the most complete savegame editor for NMS but also shows additional information around the data youre about to change. You can also easily look up each …

2026/6/10 0:00:34 阅读更多

从导航软件到游戏寻路：用C++手把手实现Dijkstra最短路径算法（附完整代码）

从导航软件到游戏寻路：用C手把手实现Dijkstra最短路径算法每次打开手机地图导航，或是操控游戏角色穿越复杂地形时，背后都藏着一个数学魔法——最短路径算法。Dijkstra算法作为图论中的经典解决方案，从1956年诞生至今，已…

2026/6/10 0:01:14 阅读更多

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱，支持下载视频、番剧等等各类资源项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/6/10 0:02:17 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/10 0:41:57 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/10 0:41:54 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/10 0:32:14 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/10 9:56:42 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/10 9:56:39 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/10 9:56:34 阅读更多

相关文章

Python 爬虫项目 爬虫任务分组管理与批量启停