03手把手学会yolov8模型之使用Labelimg标注数据集

发布时间：2026/5/20 4:03:28

概述上节讲解yolov8环境安装编译yolov8源码以及训练模型与常用参数介绍,详细介绍通过demo源码开发识别一张图片内容。模型训练核心参数model 指定模型配置文件。可以是官方的预训练权重如 yolov8n.pt也可以是自己定义的 yaml 结构文件。使用预训练权重进行迁移学习能显著加快训练速度并提高精度。 - - yolov8n/s/m/l/x.pt (n为最小最快x为最大最准)。data 指定数据集配置文件。这是一个 yaml 文件的路径文件里定义了训练集、验证集的图片路径、类别数和类别名称。例如 data/coco128.yaml 或自定义数据集配置。epochs 训练轮数。指整个数据集将被模型遍历学习的次数。轮数太少会导致欠拟合太多则可能过拟合。通常从 100 或 300 开始尝试。batch 批处理大小。指一次性喂入神经网络进行计算的样本数量。越大越稳定但消耗显存也越多。默认 16。如果显存不够报CUDA Out of Memory则调小如 8, 4如果显存充裕可以调大如 32, 64。imgsz 输入图像尺寸。会将所有输入图像统一缩放到此尺寸后再送入网络。分辨率越高对小目标检测越有利但计算量也随之增加。默认 640。小目标检测场景可尝试 896 或更高。lr0 初始学习率。控制模型权重更新的步长。过高可能导致训练不收敛过低会导致训练缓慢。默认 0.01。如果训练初期Loss震荡厉害可以适当降低如 0.001。device 训练设备。指定使用CPU还是GPU进行训练。单个GPU填 0CPU填 cpu多卡填 0,1。optimizer 优化器。用于更新网络权重的算法。默认 auto自动选择通常是 AdamW 或 SGD随机梯度下降。patience 早停耐心值。如果验证集上的精度在这么多轮内没有提升训练将自动停止防止过拟合和浪费时间。默认 50 或 100模型预测/推理参数source 输入源。指定要进行检测的对象可以是单张图片路径、文件夹路径、视频文件、摄像头ID或网络图片URL等。例如 image.jpg, videos, 0 (电脑自带摄像头)screen桌面。conf 置信度阈值。只有模型预测得分高于此值的检测框才会被保留。默认 0.25。如果误检较多可以调高如 0.5如果需要尽可能检出物体宁错勿漏可以调低如 0.1。iou 交并比阈值。用于非极大值抑制NMS决定两个重叠的框是否属于同一个物体。重叠度超过此阈值的框只保留得分最高的一个。默认 0.7。如果同一物体周围有很多重复框可以适当调低如 0.5。save 保存检测结果图。将画好检测框和标签的结果图片保存到本地。 True 或 False。save_txt 保存标签文件。将检测结果类别id、中心点坐标、宽高以YOLO格式保存为 .txt 文件。 True 或 False。max_det 最大检测数量。限制每张图片中最多检测出多少个目标。默认 300。half 半精度推理。使用FP16浮点数进行计算可以加快速度并减少显存占用精度损失极小。默认 False。推荐在支持FP16的GPU上设置为 True。classes 类别过滤。只检测你指定的某些类别。例如模型中包含人和车只想检测人可设置此参数。例如 0 或 [0,2,3]demofrom ultralytics import YOLO yoloYOLO(yolov8n.pt,detect)# 目标检测source./5.mp4视频文件,sourcescreen电脑桌面,source0摄像头 resultyolo(source./ultralytics/assets/bus.jpg,saveTrue)print(result)运行结果如下:训练数据集准备YOLOv8数据准备的目的是将原始杂乱无章的图像数据转化为算法能够理解、学习并具备泛化能力的标准化格式。经过充分的训练后它能够精准在摄像头或者视频中识别我们指定的事物如猫、狗、鱼等。yolov8不具备所有事物的识别这就要求我们自身提供数据给yolov8。如我们想要识别斯诺克需要把球的图片提供给yolov8训练并标注球的具体位置、尺寸大小。需要把数据分成三类训练集图片用于训练验证集图片用于调参测试集图片评估精度截取视频中画面准备一段视频视频内容是斯诺克比赛视频将视频中帧截取并保存图片到本地。将图片的帧截取保存图片方法很多。使用python cv2库可以很轻松的做到。在yolo8源码中新建demo2.py新建data文件夹将视频文件1.mp4放入在data文件夹中新建img文件夹用于保存生成的图片import cv2 videocv2.VideoCapture(./data/1.mp4)num0sava_step100whileTrue:ret,framevideo.read()ifnot ret:breaknum1ifnum%sava_step0:cv2.imwrite(./data/img/str(num).jpg,frame)其中sava_step是每间隔多少帧保存一张图片。点击按钮运行在img文件夹内生成图片如下图将生成的图片手动筛序将没有用的不含斯诺克的删除。图片标注图片内有很多不同颜色的斯诺克将不同颜色建立标签一一标注位置大小。使用的标注工具是labelimg。首先安装labelimg工具进入yolov8虚拟环境,conda activate yolov8安装labelimg工具pip install labelimg如下图:若下载不成功大部分是网络原因。安装完成后在命令行中输入labelimg如下图labelimg工具的使用打开labelimg设置两个参数开启自动保存更改数据训练模型yolo基本设置开启自动保存点击菜单View如下图更改数据训练模型yolo单击工具栏更改为导入训练图片选择open dir选择img文件夹图片将全部导入软件选择change sava dir选择img文件夹中dst文件夹如下图标注数据给斯诺克标注数据需要给球起标签名称如红色球red标签绿色球green标签。然后给标签画框也就是标签所在位置。点击左侧工具栏单击Create Rect选择红色球将其画在框中心画完弹出标签框若有则选择没有则创建如下操作:选择红、绿、黄三个球点击工具栏Save保存后台在dst目录生成两个文本文件如下图classes.txt内容red bule yellow1500.txt00.4156250.5305560.0218750.03611110.5011720.4000000.0273440.03888920.4289060.2041670.0187500.030556classes.txt里red、bule、yellow是创建的标签名称对于的排序序号0、1、2。而1500.txt是1500.jpg图片所标注的矩形框。第一列0、1、2序号对于的标签是red、bule、yellow。0对应red1对应bule2对于yellow第一行中后四位数字是代表所画框的中心位置坐标(x,y)与长l、宽w。第一行表示红色球的位置与大小。再继续多画几个球按住快捷键w画框如下图又多画了四个红球保存数据文件变化如下:classes.txtred bule yellow1500.txt00.4156250.5305560.0218750.03611110.5011720.4000000.0273440.03888920.4289060.2041670.0187500.03055600.6281250.1736110.0156250.02500000.5558590.6090280.0164060.03194400.5281250.6041670.0171880.03333300.5007810.6819440.0187500.036111将所有图片内的球都通过这种方式标注。如下图:从文件内容看到已经完成标注了哪些文件1500.txt对于是1500jpg文件25500.txt对于是25500jpg文件26500.txt对于是26500jpg文件27000.txt对于是27000jpg文件27500.txt对于是27500jpg文件classes具体标签内容red bule yellow green white pink black brown8类标签对应斯诺克八种秋色。查看1500图片的标注数据00.4156250.5305560.0218750.03611110.5011720.4000000.0273440.03888920.4289060.2041670.0187500.03055670.6281250.1736110.0156250.02500000.5558590.6090280.0164060.03194400.5281250.6041670.0171880.03333300.5007810.6819440.0187500.03611130.5730470.2062500.0132810.02361140.5789060.1958330.0125000.02500050.4980470.5826390.0164060.02361160.4890630.7298610.0171880.03472200.4675780.7194440.0164060.02777800.4761720.6395830.0148440.02638900.5148440.6493060.0156250.02916700.4929690.6388890.0140630.03055600.5085940.6368060.0125000.02638900.5000000.6250000.0125000.02222200.4839840.6270830.0132810.02638900.4921880.6159720.0171880.02361100.4964840.6000000.0148440.022222至此数据标注已经完成下节讲解如何整理标注的数据给yolo8模型训练将训练结果用于识别斯诺克台球比赛。

基于 HarmonyOS 6.0 的智能家政预约页面实战开发：从页面构建到跨端体验优化

基于 HarmonyOS 6.0 的智能家政预约页面实战开发：从页面构建到跨端体验优化前言随着 HarmonyOS 生态不断完善，HarmonyOS 6.0 已经不仅仅是一个移动端操作系统，而是逐渐演变为一个真正意义上的全场景分布式操作平台。对于开发者而言&#xf…

2026/5/20 4:01:47 阅读更多

Ubuntu 下 P106-100 矿卡 `nvidia-smi No devices were found` 问题解决全过程

Ubuntu 下 P106-100 矿卡 nvidia-smi No devices were found 问题解决全过程最近折腾一张老矿卡 P106-100，在 Ubuntu 下遇到一个非常经典的问题： nvidia-smi No devices were found但是： lspci | grep -i nvidia却能看到显卡： 01:00.0 3D controller: NVIDIA Corporat…

2026/5/20 4:01:07 阅读更多

5分钟终极指南：用m4s-converter永久保存你的B站缓存视频

5分钟终极指南：用m4s-converter永久保存你的B站缓存视频【免费下载链接】m4s-converter 一个跨平台小工具，将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 你是否曾经遇到过这样的烦恼…

2026/5/20 4:01:07 阅读更多

终极菜单栏清理指南：Hidden Bar让Mac界面焕然一新

终极菜单栏清理指南：Hidden Bar让Mac界面焕然一新【免费下载链接】hidden An ultra-light MacOS utility that helps hide menu bar icons 项目地址: https://gitcode.com/gh_mirrors/hi/hidden 你是否曾经为Mac菜单栏上堆积如山的图标感到烦恼？…

2026/5/20 8:55:57 阅读更多

ARMCC中断处理函数类型不匹配问题解决方案

1. ARMCC中断处理函数类型不匹配问题解析在嵌入式开发中，中断服务程序(ISR)的正确配置是确保系统稳定运行的关键。使用ARM Compiler 5（ARMCC）配合Atmel库开发时，开发者可能会遇到一个典型的类型不匹配错误。本文将深入分析这个问题…

2026/5/20 8:55:34 阅读更多

【Blender 2026最新版】Blender下载安装教程 2026最新版详细图文安装教程（超详细）

文章目录第一部分：Blender 安装前准备工作。在开始安装Blender之前，请务必确保您的计算机系统满足以下基本条件： 操作系统：64位Windows 10 或 Windows 11。内存 (RAM)：至少4GB（建议配置8GB或更高以获…

2026/5/20 8:55:13 阅读更多

手把手教你用STM32CubeMX HAL库的硬件IIC驱动AT24C02（避坑HAL_I2C_Mem_Write超时）

STM32硬件I2C驱动AT24C02实战：从超时陷阱到稳定通信的深度解析 1. 硬件I2C通信的典型痛点与解决方案第一次接触STM32的硬件I2C外设时，许多开发者都会遇到一个令人困惑的现象——明明按照官方示例代码配置了I2C参数，使用HAL_I2C_Mem_Write/Re…

2026/5/20 8:54:52 阅读更多

如何在PowerPoint中快速插入专业数学公式：LaTeX插件的终极指南

如何在PowerPoint中快速插入专业数学公式：LaTeX插件的终极指南【免费下载链接】latex-ppt Use LaTeX in PowerPoint 项目地址: https://gitcode.com/gh_mirrors/la/latex-ppt 还在为PowerPoint中复杂的数学公式排版而烦恼吗？每次手动调整积分符号…

2026/5/20 8:54:52 阅读更多

AI模型图文教程评测报告

目录前言一、评测背景与目的 1.1 参与评测模型 1.2 评分标准概述 1.3 本轮测评排名二、逐篇评分详情 2.1 第一名：Kimi-K2.6 2.2 第二名：GLM-5V-Turbo 2.3 第三名：Kimi-K2.5 2.4 第四名：GLM-5.1 2.5 第五名：Qwen3.6-Plus 2.6 第六名：DeepSeek-V4-Flash 2.7 第七名：豆包…

2026/5/20 8:54:32 阅读更多

顶伯在线语音工具背后的技术力量：AI语音合成与深度学习解析

顶伯在线语音工具背后的技术力量在人工智能浪潮中，语音交互正成为人机沟通的核心方式。顶伯作为行业领先的在线语音工具，凭借自主研发的深度学习架构，将文字转化为高度自然的语音，广泛应用于有声阅读、智能客服、教育辅助等领域。…

2026/5/20 0:00:25 阅读更多

全志V3s开发板实战：用Buildroot 2020.02.4定制你的第一个最小Linux文件系统

全志V3s开发板实战：用Buildroot 2020.02.4定制最小Linux文件系统在嵌入式开发领域，构建一个精简高效的Linux文件系统往往是项目成功的关键第一步。全志V3s作为一款高性价比的ARM Cortex-A7芯片，搭配Buildroot这一经典构建工具，能…

2026/5/20 0:00:25 阅读更多

百考通：AI赋能期刊论文写作，智能生成优质内容

在学术研究领域，期刊论文的撰写是成果输出的关键环节，却也让众多科研工作者与学生倍感压力：选题迷茫、逻辑梳理困难、格式规范复杂、内容提炼耗时，严重拖慢了学术成果的发表节奏。百考通（https://www.baikaotongai.com…

2026/5/20 0:00:46 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/20 5:14:40 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/19 6:17:20 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/20 2:02:06 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/20 5:46:58 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/20 3:00:53 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/19 22:33:20 阅读更多

相关文章