保姆级教程：用Labelme标注交通灯数据集，并一键转成YOLOv5训练格式（附完整脚本）

发布时间：2026/6/2 9:27:58

从零构建交通信号灯检测模型Labelme标注与YOLOv5格式转换全流程实战在计算机视觉领域目标检测一直是热门研究方向而交通信号灯的识别更是自动驾驶和智能交通系统中的关键环节。本文将手把手带你完成从原始图像标注到YOLOv5模型训练准备的全过程重点解决两个核心痛点如何用Labelme进行高精度多边形标注以及如何将标注结果高效转换为YOLOv5所需的训练格式。1. 环境配置与工具准备工欲善其事必先利其器。在开始标注前我们需要搭建稳定可靠的工作环境。推荐使用Anaconda创建独立的Python环境避免与系统环境产生冲突conda create -n labelme python3.8 -y conda activate labelme conda install pyqt5.15.7 -y pip install labelme5.1.1安装完成后通过终端输入labelme命令即可启动标注工具。为方便后续管理建议按以下结构创建项目目录yolov5_traffic_light/ ├── images/ # 存放原始图像 ├── annotations/ # 保存Labelme生成的JSON文件 ├── labels/ # 存放转换后的YOLO格式标签 ├── scripts/ # 存放转换脚本 └── dataset/ # 最终训练数据集2. 高质量数据标注技巧2.1 Labelme标注实操细节启动Labelme后点击Open Dir选择images文件夹加载待标注图像。标注交通信号灯时需特别注意多边形标注技巧使用滚轮放大图像至能清晰辨识信号灯边缘首尾点必须严格重合形成闭合区域对于圆形信号灯至少标注12个点以保证轮廓精度标签命名规范保持一致性如全部小写建议采用color_state格式如red_on,green_off避免使用空格和特殊字符标注示例对同一场景中的多个信号灯应分别标注并赋予正确标签。夜间场景需特别注意区分信号灯是否处于点亮状态。2.2 标注质量控制为提高模型训练效果标注时应注意完整性确保标注覆盖整个信号灯区域包括边缘光晕一致性相同类别的标注方式保持一致排除干扰不标注被遮挡超过30%的信号灯完成标注后系统会为每张图像生成对应的JSON文件包含以下关键信息{ version: 5.1.1, flags: {}, shapes: [ { label: red_on, points: [[302, 205], [310, 198], ...], shape_type: polygon } ], imagePath: IMG_001.jpg, imageData: null }3. 格式转换核心技术3.1 Labelme转YOLOv5格式原理YOLOv5要求标签文件为TXT格式每行表示一个对象包含class_id x_center y_center width height而Labelme生成的是多边形顶点坐标需要进行以下转换将多边形转换为最小外接矩形将绝对坐标归一化为相对坐标0-1范围计算中心点和宽高转换脚本核心逻辑def polygon_to_yolo(points, img_width, img_height): x_coords [p[0] for p in points] y_coords [p[1] for p in points] x_min, x_max min(x_coords), max(x_coords) y_min, y_max min(y_coords), max(y_coords) x_center (x_min x_max) / 2 / img_width y_center (y_min y_max) / 2 / img_height width (x_max - x_min) / img_width height (y_max - y_min) / img_height return [x_center, y_center, width, height]3.2 完整转换脚本实现创建json2yolo.py脚本实现批量转换import os import json from tqdm import tqdm def convert(json_dir, output_dir, class_list): os.makedirs(output_dir, exist_okTrue) for json_file in tqdm(os.listdir(json_dir)): if not json_file.endswith(.json): continue with open(os.path.join(json_dir, json_file)) as f: data json.load(f) txt_path os.path.join(output_dir, json_file.replace(.json, .txt)) with open(txt_path, w) as f: for shape in data[shapes]: class_id class_list.index(shape[label]) points shape[points] bbox polygon_to_yolo(points, data[imageWidth], data[imageHeight]) line f{class_id} { .join(map(str, bbox))}\n f.write(line) if __name__ __main__: convert(annotations, labels, [red_on, yellow_on, green_on])4. 数据集划分与验证4.1 科学划分数据集合理的数据集划分对模型评估至关重要推荐比例数据集比例用途训练集70%模型训练验证集20%超参数调优测试集10%最终评估实现代码片段def split_dataset(image_dir, label_dir, output_dir, ratios(0.7, 0.2, 0.1)): files [f for f in os.listdir(image_dir) if f.endswith(.jpg)] random.shuffle(files) train_idx int(len(files) * ratios[0]) val_idx train_idx int(len(files) * ratios[1]) splits { train: files[:train_idx], val: files[train_idx:val_idx], test: files[val_idx:] } for split, files in splits.items(): os.makedirs(os.path.join(output_dir, split, images), exist_okTrue) os.makedirs(os.path.join(output_dir, split, labels), exist_okTrue) for file in files: # 复制图像和标签文件到对应目录 ...4.2 数据一致性检查转换完成后必须验证数据质量图像-标签匹配检查# 检查文件数量是否一致 ls images/*.jpg | wc -l ls labels/*.txt | wc -l标注可视化验证使用以下脚本将YOLO格式标注绘制到图像上import cv2 def visualize(image_path, label_path, class_names): image cv2.imread(image_path) height, width image.shape[:2] with open(label_path) as f: for line in f: class_id, xc, yc, w, h map(float, line.strip().split()) x1 int((xc - w/2) * width) y1 int((yc - h/2) * height) x2 int((xc w/2) * width) y2 int((yc h/2) * height) cv2.rectangle(image, (x1, y1), (x2, y2), (0,255,0), 2) cv2.putText(image, class_names[int(class_id)], (x1, y1-10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0,255,0), 2) cv2.imshow(Preview, image) cv2.waitKey(0)5. 高效标注的工程实践5.1 标注效率提升技巧快捷键记忆CtrlO打开目录CtrlS保存当前标注Ctrl鼠标滚轮快速缩放批量处理技巧# 批量检查JSON文件完整性 find annotations/ -name *.json -exec jq . {} /dev/null \;5.2 常见问题解决方案问题现象可能原因解决方案转换后坐标超出[0,1]范围标注点超出图像边界检查标注时是否误点在图像外转换后bbox宽高为0首尾点未重合确保多边形闭合类别ID错误class_list顺序不匹配保持转换和训练使用相同class_list在实际项目中建议建立标注规范文档包含标签命名规则标注质量要求特殊情况处理指南验收标准经过完整流程处理后的数据集可直接用于YOLOv5模型的练。将数据集按照YOLOv5要求的目录结构组织后创建对应的YAML配置文件即可开始训练。

陕西沫清风户外雨棚 60 年质保深度调查：品牌承诺真相揭示

核心结论调查发现，网络流传的 "60 年不生锈质保" 存在误解，沫清风官方合同明确铝合金框架质保为 30 年，经第三方检测中性盐雾试验 1500 小时无锈蚀，西北正常使用下防锈寿命可达 30-40 年。误解源于市场宣传表述偏差&…

2026/6/2 9:27:18 阅读更多

保姆级避坑指南：在Unity 2022中调出真实烟花效果的10个关键参数

Unity 2022真实烟花效果调参实战：从物理规律到视觉欺骗的艺术烟花效果一直是游戏和影视特效中的经典难题——既要符合物理规律，又要超越现实营造视觉奇观。在Unity 2022 LTS版本中，Particle System经过多次迭代已经具备了制作电影级特效的潜…

2026/6/2 9:27:18 阅读更多

HsMod终极指南：三步解决炉石传说游戏体验的三大核心痛点

HsMod终极指南：三步解决炉石传说游戏体验的三大核心痛点【免费下载链接】HsMod Hearthstone Modification Based on BepInEx 项目地址: https://gitcode.com/GitHub_Trending/hs/HsMod HsMod是基于BepInEx框架开发的炉石传说游戏增强插件，能够显…

2026/6/2 9:27:18 阅读更多

Agent Harness Engineering综述：一篇读懂 AI Agent 真正的工程瓶颈

写在前面欢迎大家关注Rocky的公众号：WeThinkIn 欢迎大家关注Rocky的知乎：Rocky Ding AIGC算法工程师/开发工程师面试面经秘籍分享：WeThinkIn/Interview-for-Algorithm-Engineer欢迎大家Star～ AIGC时代的《三年面试五年模拟》AI算…

2026/6/2 22:13:34 阅读更多

手把手教你用AWR2944开发板配置DDMA波形：从Lua脚本到Matlab数据处理全流程

手把手教你用AWR2944开发板配置DDMA波形：从Lua脚本到Matlab数据处理全流程毫米波雷达技术在自动驾驶、工业检测等领域的应用日益广泛，而德州仪器（TI）的AWR2944开发板因其出色的性能和灵活的配置选项，成为许多工程师和研…

2026/6/2 22:13:14 阅读更多

紧急更新！Claude 3.5接入新规下计划书重构指南：3天内必须调整的5处合规红线与替代方案

更多请点击： https://kaifayun.com 第一章：Claude 3.5接入新规背景与合规性总览随着Anthropic正式发布Claude 3.5 Sonnet，全球开发者和企业对新一代模型的接入需求激增。为保障数据主权、防范滥用风险并满足多司法辖区监管要求，…

2026/6/2 22:12:06 阅读更多

手把手教你用Nginx在openEuler 22.03上搭建内网yum源（附createrepo命令详解）

企业级openEuler内网yum源构建实战：从零搭建到性能调优在数字化转型浪潮中，企业IT基础设施的稳定性和安全性愈发重要。对于采用openEuler系统的组织而言，内网软件仓库的搭建不仅是网络隔离环境下的刚需，更是实现高效运维、安全管控…

2026/6/2 22:10:39 阅读更多

鸣潮模组终极指南：15+功能全面解锁，5分钟提升游戏体验

鸣潮模组终极指南：15功能全面解锁，5分钟提升游戏体验【免费下载链接】wuwa-mod Wuthering Waves pak mods 项目地址: https://gitcode.com/GitHub_Trending/wu/wuwa-mod 你是否厌倦了《鸣潮》游戏中的技能冷却等待？是否希望探索世界时…

2026/6/2 22:10:39 阅读更多

Doherty功放设计进阶：从对称到非对称，再到多峰值的ADS仿真全攻略

Doherty功放设计进阶：从对称到非对称，再到多峰值的ADS仿真全攻略在5G和下一代通信系统快速发展的背景下，功率放大器设计面临着前所未有的效率挑战。传统对称Doherty架构的6dB回退范围已无法满足高阶调制信号9-12dB的峰均比需求。本文将带您深…

2026/6/2 22:10:18 阅读更多

从 Prompt 到生产闭环：Spring AI Tool Calling 深度拆解与企业级落地

从 Prompt 到生产闭环：Spring AI Tool Calling 深度拆解与企业级落地摘要 Tool Calling 是大模型系统从“会回答”走向“会执行”的关键能力。很多文章只停留在 @Tool 注解和 Hello World 级别示例，但一旦进入生产环境，问题很快从“怎么调用”升级为“怎么控延迟、怎么控风…

2026/6/2 0:01:22 阅读更多

解耦安防碎片化：基于 Docker 与边缘计算的 AI 视频中台架构设计（支持 GB28181/RTSP 与源码交付）

在智能视频分析（IVA）与产业物联网（IoT）大行其道的今天，政企级安防项目的落地依然面临着严重的碎片化挑战。对于系统集成商和独立软件开发商（ISV）而言，传统的流媒体研发存在两大核心痛…

2026/6/2 0:03:04 阅读更多

解耦品牌壁垒：基于 Docker 与边缘计算的高并发视频中台架构（支持 GB28181/RTSP 统一接入与源码交付）

在泛安防与产业物联网（IoT）工程落地中，系统集成商与技术团队往往深陷于底层流媒体对接的碎片化泥潭。一方面，前端摄像机、IPC、NVR 品牌林立（如海康、大华、宇视等），其 GB28181 国标协议的信令交…

2026/6/2 0:03:04 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/2 3:04:55 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/2 3:51:01 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/2 1:12:03 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/2 5:03:37 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/2 0:27:25 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/2 2:18:01 阅读更多

相关文章

陕西沫清风户外雨棚 60 年质保深度调查：品牌承诺真相揭示

保姆级避坑指南：在Unity 2022中调出真实烟花效果的10个关键参数

HsMod终极指南：三步解决炉石传说游戏体验的三大核心痛点

Agent Harness Engineering综述：一篇读懂 AI Agent 真正的工程瓶颈

手把手教你用AWR2944开发板配置DDMA波形：从Lua脚本到Matlab数据处理全流程

紧急更新！Claude 3.5接入新规下计划书重构指南：3天内必须调整的5处合规红线与替代方案

手把手教你用Nginx在openEuler 22.03上搭建内网yum源（附createrepo命令详解）

鸣潮模组终极指南：15+功能全面解锁，5分钟提升游戏体验

Doherty功放设计进阶：从对称到非对称，再到多峰值的ADS仿真全攻略

从 Prompt 到生产闭环：Spring AI Tool Calling 深度拆解与企业级落地

解耦安防碎片化：基于 Docker 与边缘计算的 AI 视频中台架构设计（支持 GB28181/RTSP 与源码交付）

解耦品牌壁垒：基于 Docker 与边缘计算的高并发视频中台架构（支持 GB28181/RTSP 统一接入与源码交付）

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因