从Kaggle猫狗数据到可运行模型：YOLOv5s.pt训练全流程拆解（附完整代码与配置文件）

发布时间：2026/6/3 3:37:26

从Kaggle猫狗数据到可运行模型YOLOv5s.pt训练全流程拆解在计算机视觉领域目标检测一直是一个热门研究方向。YOLO(You Only Look Once)系列算法因其速度快、精度高的特点成为工业界和学术界广泛使用的目标检测框架。本文将详细介绍如何使用YOLOv5s.pt模型在Kaggle猫狗数据集上完成端到端的训练流程包括数据准备、环境配置、模型训练和结果验证等关键步骤。1. 环境准备与工具安装1.1 硬件与基础软件要求YOLOv5训练对硬件有一定要求建议配置GPUNVIDIA显卡推荐RTX 2060及以上显存≥6GB内存≥16GB存储空间至少50GB可用空间用于存放数据集和模型操作系统Windows 10/11或LinuxUbuntu 18.04基础软件依赖# 检查NVIDIA驱动是否安装 nvidia-smi # 输出应显示GPU信息如CUDA版本等1.2 Python环境配置推荐使用conda创建独立Python环境conda create -n yolov5 python3.8 conda activate yolov5安装PyTorch注意选择与CUDA版本匹配的安装命令# 以CUDA 11.3为例 pip install torch1.12.1cu113 torchvision0.13.1cu113 torchaudio0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113验证PyTorch是否正确识别GPUimport torch print(torch.__version__) # 应显示1.12.1 print(torch.cuda.is_available()) # 应输出True2. 数据集准备与标注2.1 获取Kaggle猫狗数据集访问Kaggle官网下载Dogs vs Cats数据集解压后目录结构应如下dogs-vs-cats/ ├── train/ │ ├── cat.0.jpg │ ├── dog.0.jpg │ └── ... └── test/ ├── 1.jpg └── ...2.2 数据标注工具使用推荐使用labelImg进行标注pip install labelImg labelImg # 启动标注工具标注时注意选择YOLO格式输出类别命名规范cat和dog保存的txt文件每行格式class_id x_center y_center width height2.3 数据集组织与划分最终数据集目录结构custom_data/ ├── images/ │ ├── train/ # 训练图片 │ └── val/ # 验证图片 └── labels/ ├── train/ # 训练标签 └── val/ # 验证标签可使用以下Python代码划分训练集和验证集import os import random from shutil import copyfile def split_dataset(src_img, src_label, train_ratio0.8): # 创建目录结构 os.makedirs(custom_data/images/train, exist_okTrue) os.makedirs(custom_data/images/val, exist_okTrue) os.makedirs(custom_data/labels/train, exist_okTrue) os.makedirs(custom_data/labels/val, exist_okTrue) # 获取所有图片文件 files [f for f in os.listdir(src_img) if f.endswith(.jpg)] random.shuffle(files) # 划分数据集 split_idx int(len(files)*train_ratio) for i, file in enumerate(files): base os.path.splitext(file)[0] if i split_idx: # 训练集 copyfile(f{src_img}/{file}, fcustom_data/images/train/{file}) copyfile(f{src_label}/{base}.txt, fcustom_data/labels/train/{base}.txt) else: # 验证集 copyfile(f{src_img}/{file}, fcustom_data/images/val/{file}) copyfile(f{src_label}/{base}.txt, fcustom_data/labels/val/{base}.txt)3. YOLOv5模型配置3.1 下载YOLOv5代码和预训练模型git clone https://github.com/ultralytics/yolov5 cd yolov5 pip install -r requirements.txt下载预训练模型wget https://github.com/ultralytics/yolov5/releases/download/v6.0/yolov5s.pt -P weights/3.2 配置文件修改数据配置文件(data/custom.yaml):# 训练和验证数据路径 train: ../custom_data/images/train val: ../custom_data/images/val # 类别数量和名称 nc: 2 names: [cat, dog]模型配置文件(models/yolov5s_custom.yaml):# 参数 nc: 2 # 类别数 depth_multiple: 0.33 # 模型深度倍数 width_multiple: 0.50 # 层通道倍数 # 锚点框 anchors: - [10,13, 16,30, 33,23] # P3/8 - [30,61, 62,45, 59,119] # P4/16 - [116,90, 156,198, 373,326] # P5/32 # 主干网络 backbone: # [from, number, module, args] [[-1, 1, Conv, [64, 6, 2, 2]], # 0-P1/2 [-1, 1, Conv, [128, 3, 2]], # 1-P2/4 [-1, 3, C3, [128]], [-1, 1, Conv, [256, 3, 2]], # 3-P3/8 [-1, 6, C3, [256]], [-1, 1, Conv, [512, 3, 2]], # 5-P4/16 [-1, 9, C3, [512]], [-1, 1, Conv, [1024, 3, 2]], # 7-P5/32 [-1, 3, C3, [1024]], [-1, 1, SPPF, [1024, 5]], # 9 ] # 检测头 head: [[-1, 1, Conv, [512, 1, 1]], [-1, 1, nn.Upsample, [None, 2, nearest]], [[-1, 6], 1, Concat, [1]], # cat backbone P4 [-1, 3, C3, [512, False]], # 13 [-1, 1, Conv, [256, 1, 1]], [-1, 1, nn.Upsample, [None, 2, nearest]], [[-1, 4], 1, Concat, [1]], # cat backbone P3 [-1, 3, C3, [256, False]], # 17 (P3/8-small) [-1, 1, Conv, [256, 3, 2]], [[-1, 14], 1, Concat, [1]], # cat head P4 [-1, 3, C3, [512, False]], # 20 (P4/16-medium) [-1, 1, Conv, [512, 3, 2]], [[-1, 10], 1, Concat, [1]], # cat head P5 [-1, 3, C3, [1024, False]], # 23 (P5/32-large) [[17, 20, 23], 1, Detect, [nc, anchors]], # Detect(P3, P4, P5) ]4. 模型训练与调优4.1 启动训练基本训练命令python train.py --img 640 --batch 16 --epochs 100 --data data/custom.yaml --cfg models/yolov5s_custom.yaml --weights weights/yolov5s.pt --name cat_dog_detection关键参数说明参数说明推荐值--img输入图像尺寸640--batch批次大小根据GPU显存调整--epochs训练轮数100-300--data数据配置文件data/custom.yaml--cfg模型配置文件models/yolov5s_custom.yaml--weights预训练权重weights/yolov5s.pt--name实验名称自定义4.2 训练监控与可视化YOLOv5会自动记录训练日志可通过TensorBoard查看tensorboard --logdir runs/train主要监控指标损失函数box_loss, obj_loss, cls_loss评估指标precision, recall, mAP0.5, mAP0.5:0.95学习率当前学习率变化4.3 训练调优技巧学习率调整初始学习率0.01使用余弦退火调度器可通过--lr0参数调整数据增强默认启用Mosaic增强可通过--hyp指定超参数文件调整增强强度早停机制设置--patience参数如50当指标不再提升时自动停止训练5. 模型验证与测试5.1 验证集评估python val.py --weights runs/train/cat_dog_detection/weights/best.pt --data data/custom.yaml --img 640输出示例Class Images Instances P R mAP.5 mAP.5:.95 all 100 1500 0.95 0.92 0.94 0.72 cat 100 750 0.96 0.93 0.95 0.73 dog 100 750 0.94 0.91 0.93 0.715.2 单张图片测试python detect.py --weights runs/train/cat_dog_detection/weights/best.pt --source test_image.jpg --conf 0.5参数说明--source可指定图片、视频或摄像头0--conf置信度阈值--save-txt保存检测结果为YOLO格式5.3 性能测试python test.py --weights runs/train/cat_dog_detection/weights/best.pt --data data/custom.yaml --task speed输出示例Fusing layers... Model summary: 224 layers, 7266973 parameters, 0 gradients Speed: 2.0ms pre-process, 4.5ms inference, 1.0ms NMS per image at shape (1, 3, 640, 640)6. 常见问题与解决方案6.1 显存不足问题现象训练时出现CUDA out of memory错误解决方案减小--batch-size如从16降到8减小--img-size如从640降到416使用更小的模型如yolov5n.pt6.2 类别不平衡问题现象某个类别如猫的检测效果明显差于另一类别解决方案检查数据集标注是否正确使用类别权重修改损失函数增加少数类别的数据增强6.3 模型过拟合问题现象训练集指标很好但验证集指标差解决方案增加数据增强强度使用早停机制添加正则化如Dropout减少模型复杂度7. 模型部署与应用7.1 模型导出为ONNX格式python export.py --weights runs/train/cat_dog_detection/weights/best.pt --include onnx --img 6407.2 使用OpenCV调用模型import cv2 import numpy as np # 加载模型 net cv2.dnn.readNet(best.onnx) # 预处理图像 image cv2.imread(test.jpg) blob cv2.dnn.blobFromImage(image, 1/255.0, (640, 640), swapRBTrue, cropFalse) # 推理 net.setInput(blob) outputs net.forward(net.getUnconnectedOutLayersNames()) # 后处理 # ... (解析输出结果)7.3 模型量化与优化FP16量化python export.py --weights best.pt --include onnx --halfTensorRT加速python export.py --weights best.pt --include engine --device 0在实际项目中我们通常会根据硬件平台选择最优的部署方式。例如在边缘设备上可以使用TensorRT加速而在服务器端可以使用ONNX Runtime进行推理。

区块链网络与跨链操作03：区块链数据验证机制

区块链网络与跨链操作03：区块链数据验证机制（区块链网络与跨链操作03） 前言这篇是前面一章：区块链原理与技术03：区块链数据传输协议（区块链网络与跨链操作02）第十四节就已经介绍过了&#xff…

2026/6/3 3:35:26 阅读更多

LabVIEW直连GPU加速环境安装包（含NVIDIA/AMD驱动与运行库）

本文还有配套的精品资源，点击获取简介：一套开箱即用的LabVIEW GPU加速部署方案，集成NI官方GPU计算模块安装程序（setup.exe）、核心运行时组件（NISysInf.dll及bin目录文件）、GPU许可证文件&am…

2026/6/3 3:33:24 阅读更多

硅胶制品厂主要集中在哪些地方？

答：中国硅胶制品工厂高度集中在广东（东莞、深圳、中山）、浙江（宁波、温州）、福建（漳州、厦门）三大核心产区，其中广东东莞一地的在产工厂数量约占全国总量的 30%—35%；此外…

2026/6/3 3:30:29 阅读更多

别再只会用原版U-Net了！手把手教你用Attention U-Net和CBAM改进医学图像分割（附代码思路）

医学图像分割进阶：Attention U-Net与CBAM模块的实战优化指南在医学影像分析领域，U-Net凭借其优雅的对称结构和高效的跳跃连接机制，已成为分割任务的基础架构。但当面对器官边界模糊、病灶形态多变等复杂场景时，传统U-Net往往力不…

2026/6/3 4:15:40 阅读更多

【手把手实战教学】基于C#和.NET Framework的WinForms开发教程系列（6）AutoUpdater.NET自动更新

【手把手实战教学】基于C#和.NET Framework的WinForms开发教程系列（6）AutoUpdater.NET 自动更新系列目录 （1）Visual Studio 2026 中创建、运行、发布应用 （2）开机自启 （3）自动定时…

2026/6/3 4:15:40 阅读更多

5分钟掌握跨平台资源下载神器：一键获取视频号、抖音、小红书等全网资源

5分钟掌握跨平台资源下载神器：一键获取视频号、抖音、小红书等全网资源【免费下载链接】res-downloader 视频号、小程序、抖音、快手、小红书、直播流、m3u8、酷狗、QQ音乐等常见网络资源下载! 项目地址: https://gitcode.com/GitHub_Trending/re/res-downloader…

2026/6/3 4:15:20 阅读更多

回收奥林巴斯Olympus CX43金相显微镜

成色要求:6-7成新，无划痕/无磨损/外观轻微使用痕迹二手基础配置:包好，有质保仪器介绍:CX43显微镜可以让您在长时间的常规观察中始终保持舒适。显微镜镜架与您的手始终保持协调，控制旋钮的位置通过人体工学设计提高工作效率。一只手仅需低限度…

2026/6/3 4:14:33 阅读更多

【LLM】第三章：项目实操案例：智能输入法项目

【LLM】第三章：项目实操案例：智能输入法项目说明：本篇是根据 https://www.bilibili.com/video/BV1k44LzPEhU?spm_id_from333.788.player.switch&vd_sourceb6780e06031ac609460f6fbf017bbb39&p38 视频中的案例爆改重构而成的&#…

2026/6/3 4:14:33 阅读更多

科技与艺术的跨界融合：从条形码到思辨设计的创新启示

1. 当科研遇见艺术：一次意料之外的跨界之旅我猜，大多数埋头在实验室里敲代码、跑数据、焊电路板的工程师和研究员们，很少会把自己的日常工作与“艺术”这个词联系起来。我们的世界通常由清晰的逻辑、可复现的实验和解决具体问题的方案构成。然…

2026/6/3 4:14:33 阅读更多

解决Unity打包EXE后Universal Media Player播放RTSP失败：从修改Player Settings到手动修复UMPPostBuilds.cs

Unity打包EXE后Universal Media Player播放RTSP失败的深度修复指南当你在Unity中使用Universal Media Player（UMP）插件成功实现了RTSP流的播放，却在打包EXE后遭遇"无画面"或"找不到库文件"的错误时，这种从开发…

2026/6/3 0:00:49 阅读更多

ESP32工业物联网控制器：4-20mA压力变送器信号采集与处理实战

1. 项目概述与核心价值在工业现场，数据采集的稳定性和准确性是命脉。无论是监测管道压力、罐体液位还是电机转速，我们都需要将物理世界的信号，可靠地转换为控制系统能理解的“语言”。这其中，4-20mA电流环信号堪称工业模拟信号传输…

2026/6/3 0:00:49 阅读更多

基于Arduino与超声波传感器的DIY无人机计时门设计与实现

1. 项目概述：为FPV竞速增添专业感的DIY计时门如果你和我一样，家里有个对FPV无人机着迷的孩子，或者你自己就是个竞速爱好者，那你肯定理解那种想给自家的小型无人机赛道增加点“专业感”的冲动。我们在地下室用纸箱、呼啦圈搭过各种…

2026/6/3 0:00:49 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/2 3:04:55 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/2 3:51:01 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/2 1:12:03 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/2 5:03:37 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/2 0:27:25 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/2 2:18:01 阅读更多

相关文章

区块链网络与跨链操作03：区块链数据验证机制

LabVIEW直连GPU加速环境安装包（含NVIDIA/AMD驱动与运行库）

硅胶制品厂主要集中在哪些地方？

别再只会用原版U-Net了！手把手教你用Attention U-Net和CBAM改进医学图像分割（附代码思路）

【手把手实战教学】基于C#和.NET Framework的WinForms开发教程系列（6）AutoUpdater.NET自动更新

5分钟掌握跨平台资源下载神器：一键获取视频号、抖音、小红书等全网资源

回收奥林巴斯Olympus CX43金相显微镜

【LLM】第三章：项目实操案例：智能输入法项目

科技与艺术的跨界融合：从条形码到思辨设计的创新启示

解决Unity打包EXE后Universal Media Player播放RTSP失败：从修改Player Settings到手动修复UMPPostBuilds.cs

ESP32工业物联网控制器：4-20mA压力变送器信号采集与处理实战

基于Arduino与超声波传感器的DIY无人机计时门设计与实现

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因