Labelme生成的JSON文件别乱扔！手把手教你用Python脚本批量转成YOLO格式

发布时间：2026/6/18 3:45:19

Labelme标注数据工程化Python脚本实现YOLO格式批量转换实战在计算机视觉项目的实际开发流程中数据标注往往只完成了整个工作流的20%而剩下的80%精力都消耗在数据清洗、格式转换和验证环节。当你用Labelme精心标注了数百张图像后那些生成的JSON文件就像未经雕琢的玉石——价值连城但需要专业加工才能发挥真正作用。1. 理解Labelme与YOLO的数据格式差异Labelme生成的JSON文件采用绝对坐标记录多边形顶点而YOLO需要的却是归一化后的中心点坐标和宽高比例。这种本质差异导致直接使用原始标注会面临三个核心挑战坐标系转换从图像像素坐标系到YOLO的归一化坐标系0-1范围形状描述转换从多边形顶点序列到边界框的数学表达标签映射从文本标签到YOLO要求的类别索引典型的Labelme JSON结构关键字段如下{ version: 5.1.1, flags: {}, shapes: [ { label: cat, points: [[302,240],[402,240],[402,340],[302,340]], shape_type: polygon } ], imagePath: example.jpg, imageWidth: 800, imageHeight: 600 }对应的YOLO格式要求每张图片一个txt文件每行表示一个对象class_id x_center y_center width height2. 构建Python转换脚本的核心逻辑2.1 基础转换函数实现创建一个labelme2yolo.py文件首先实现核心几何计算函数import json import os import numpy as np def polygon_to_yolo(polygon_points, img_width, img_height): 将多边形顶点转换为YOLO格式的边界框 points np.array(polygon_points) x_min, y_min np.min(points, axis0) x_max, y_max np.max(points, axis0) # 计算中心点和宽高归一化 x_center ((x_min x_max) / 2) / img_width y_center ((y_min y_max) / 2) / img_height width (x_max - x_min) / img_width height (y_max - y_min) / img_height return x_center, y_center, width, height2.2 批量处理与文件输出添加目录遍历和文件输出逻辑def process_labelme_json(json_path, class_mapping, output_dir): with open(json_path, r) as f: data json.load(f) txt_lines [] for shape in data[shapes]: if shape[shape_type] ! polygon: continue class_name shape[label].lower() if class_name not in class_mapping: continue # 转换坐标 x_center, y_center, width, height polygon_to_yolo( shape[points], data[imageWidth], data[imageHeight] ) txt_lines.append(f{class_mapping[class_name]} {x_center:.6f} {y_center:.6f} {width:.6f} {height:.6f}) # 写入YOLO格式文件 base_name os.path.splitext(os.path.basename(json_path))[0] txt_path os.path.join(output_dir, f{base_name}.txt) with open(txt_path, w) as f: f.write(\n.join(txt_lines))3. 工程化实践中的关键问题处理3.1 复杂多边形的优化策略当遇到复杂多边形时直接取最小外接矩形可能导致标注质量下降。我们可以在转换前对多边形进行凸包处理from scipy.spatial import ConvexHull def optimize_polygon(points): 对复杂多边形进行凸包优化 hull ConvexHull(points) return [points[i] for i in hull.vertices]3.2 多线程批量处理对于大型数据集添加多线程支持可以显著提升处理速度from concurrent.futures import ThreadPoolExecutor def batch_convert(input_dir, output_dir, class_mapping, workers4): os.makedirs(output_dir, exist_okTrue) json_files [f for f in os.listdir(input_dir) if f.endswith(.json)] with ThreadPoolExecutor(max_workersworkers) as executor: for json_file in json_files: executor.submit( process_labelme_json, os.path.join(input_dir, json_file), class_mapping, output_dir )4. 数据验证与质量检查转换完成后必须验证结果准确性这里提供一个可视化检查脚本import cv2 def visualize_yolo_annotation(image_path, txt_path, class_names): image cv2.imread(image_path) height, width image.shape[:2] with open(txt_path, r) as f: for line in f: class_id, xc, yc, w, h map(float, line.strip().split()) # 转换回像素坐标 x int((xc - w/2) * width) y int((yc - h/2) * height) box_w int(w * width) box_h int(h * height) # 绘制边界框 cv2.rectangle(image, (x,y), (xbox_w,ybox_h), (0,255,0), 2) cv2.putText(image, class_names[int(class_id)], (x, y-10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0,255,0), 2) cv2.imshow(Validation, image) cv2.waitKey(0) cv2.destroyAllWindows()5. 完整项目结构与管理建议采用以下目录结构组织转换项目labelme2yolo/ ├── src/ │ ├── converter.py # 主转换脚本 │ ├── validator.py # 验证脚本 │ └── utils.py # 工具函数 ├── configs/ │ └── classes.yaml # 类别映射配置 ├── input_data/ # 原始Labelme数据 │ ├── images/ # 原图目录 │ └── annotations/ # JSON标注目录 └── output_data/ # 转换输出 ├── images/ # 图片可符号链接 └── labels/ # YOLO格式标签示例classes.yaml配置文件class_mapping: cat: 0 dog: 1 person: 26. 高级技巧与性能优化6.1 内存映射加速大文件处理对于超大JSON文件100MB可以使用ijson库进行流式处理import ijson def process_large_json(json_path): with open(json_path, rb) as f: objects ijson.items(f, shapes.item) for shape in objects: # 处理每个shape对象 pass6.2 增量处理与断点续传添加检查点机制避免重复处理def batch_convert_with_checkpoint(input_dir, output_dir, checkpoint_file): processed set() if os.path.exists(checkpoint_file): with open(checkpoint_file, r) as f: processed.update(f.read().splitlines()) with open(checkpoint_file, a) as checkpoint: for json_file in os.listdir(input_dir): if json_file in processed: continue # 处理文件... checkpoint.write(f{json_file}\n)6.3 并行GPU加速计算对于超大规模数据集可以使用CUDA加速几何计算import cupy as cp def gpu_polygon_to_yolo(polygon_points, img_width, img_height): points cp.array(polygon_points) x_min, y_min cp.min(points, axis0) x_max, y_max cp.max(points, axis0) x_center ((x_min x_max) / 2) / img_width y_center ((y_min y_max) / 2) / img_height width (x_max - x_min) / img_width height (y_max - y_min) / img_height return x_center.get(), y_center.get(), width.get(), height.get()

Arduino低功耗改造：一节AA电池驱动日历时钟运行50年

1. 项目概述：一个能跑50年的日历时钟作为一名常年和嵌入式系统打交道的硬件开发者，我一直在寻找那些能将极致的低功耗设计与巧妙的硬件改造结合起来的项目。最近，我动手复现并深度优化了一个非常有意思的创意：将一个普通的石英挂…

2026/6/18 3:44:43 阅读更多

一键永久激活Windows和Office：KMS智能激活完整指南

一键永久激活Windows和Office：KMS智能激活完整指南【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows系统激活烦恼吗？每次重装系统后都要重新激活Office&…

2026/6/14 8:10:56 阅读更多

Arduino绘画机器人：传感器融合与自主行为控制实践

1. 项目概述：当机器人拿起画笔在创客和STEAM教育圈子里，我们总在寻找那些能将技术原理与创意表达无缝结合的项目。今天要聊的ChromaBots绘画机器人，就是这样一个绝佳的例子。它不是一个简单的循线小车，也不是一个呆板的绘图仪&…

2026/6/17 21:10:17 阅读更多

终极指南：3步让老旧Mac重获新生，运行最新macOS系统

终极指南：3步让老旧Mac重获新生，运行最新macOS系统【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 你是否有一台被苹果官方抛弃的老旧…

2026/6/18 3:44:00 阅读更多

企业级AI落地的现实检验：从POC到价值闭环的七道工序

1. 项目概述：这不是一场技术发布会，而是一次企业级AI的“体检报告”“The Reality Check for Enterprise AI”——这个标题一出现，我就在会议室白板上画了个大大的问号。过去三年，我深度参与过17家不同行业企业的AI落地项目&#…

2026/6/18 3:43:38 阅读更多

GNN实战避坑指南：消息传递、图同构与异构建模

1. 这不是又一个“图神经网络入门”——它是一份能让你在真实项目里调通模型、看懂报错、改对结构的实战手记Graph Neural Networks（GNN）这个词，过去三年在技术会议、招聘JD和论文标题里出现的频率，已经快赶上“Transformer”了。…

2026/6/18 3:43:38 阅读更多

医疗AI落地实战：心血管风险预警的可解释机器学习方案

1. 这不是“预测心脏病发作”的花架子，而是临床一线能真正落地的机器学习方案“Predicting Heart Attacks Using Machine Learning Models: A Comprehensive Approach”——这个标题里没有一个词是虚的。它不讲概念、不堆术语、不画大饼，说的就是一件事&…

2026/6/18 3:41:08 阅读更多

双增强双塔模型：解决跨塔交互缺失与类目失衡的工业级推荐方案

1. 项目概述：为什么我们需要一个“双增强”的双塔模型？ 我做推荐系统工程落地快八年了，从最早在电商大促期间手调LRGBDT的粗排模块，到后来带团队搭整套向量召回链路，踩过的坑比读过的论文还多。这几年最常被问的问题就…

2026/6/18 3:40:04 阅读更多

Penpot云原生设计平台：基于分层抽象架构的分布式系统深度解析

Penpot云原生设计平台：基于分层抽象架构的分布式系统深度解析【免费下载链接】penpot Penpot: The open-source design tool for design and code collaboration 项目地址: https://gitcode.com/GitHub_Trending/pe/penpot Penpot作为开源云原生设计协作平台…

2026/6/18 3:38:01 阅读更多

Java毕设选题推荐：基于 Spring Boot 的个人随笔博客运维管理系统的设计与实现基于 Spring Boot 的用户原创博客分享社区【附源码、mysql、文档、调试+代码讲解+全bao等】

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…

2026/6/18 0:00:19 阅读更多

【IC】【Low Power】从功耗构成到设计实践：CMOS低功耗技术全景解析

1. CMOS电路功耗构成解析在芯片设计中，功耗就像汽车的油耗指标，直接影响着设备的续航能力和发热表现。想象一下你的手机如果功耗控制不好，可能用不了半天就得充电，还会烫得像暖手宝。CMOS电路的功耗主要来自两个"耗电大户&q…

2026/6/18 0:02:02 阅读更多

跨平台音乐播放神器：LX Music桌面版一站式解决多平台音乐聚合难题

跨平台音乐播放神器：LX Music桌面版一站式解决多平台音乐聚合难题【免费下载链接】lx-music-desktop 一个基于 Electron 的音乐软件项目地址: https://gitcode.com/GitHub_Trending/lx/lx-music-desktop 你是否厌倦了在不同音乐平台间来回切换？…

2026/6/18 0:04:07 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

音乐文件解锁实战指南：3个场景解决你的播放困境【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://git…

2026/6/18 0:35:55 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

遥感卫星数据选型实战指南：从参数解析到场景化应用当面对GEE、PIE-Engine等云平台上数十种遥感数据源时，许多研究者常陷入选择困难——Landsat的历史连续性、Sentinel-2的红边波段优势、高分系列的亚米级分辨率各有千秋。本文将打破常规参数罗列式对比&a…

2026/6/18 0:35:55 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

1. 项目概述：MC68302 AutoBaud技术深度解析在嵌入式系统开发，尤其是那些需要与外部设备进行串口通信的场景里，最让人头疼的环节之一就是波特率匹配。想象一下，你设计了一个数据采集终端，需要连接来自不同厂家、不同年代…

2026/6/18 0:35:55 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/17 11:00:37 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/17 11:00:26 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/17 11:00:22 阅读更多

相关文章

Arduino低功耗改造：一节AA电池驱动日历时钟运行50年

一键永久激活Windows和Office：KMS智能激活完整指南

Arduino绘画机器人：传感器融合与自主行为控制实践

终极指南：3步让老旧Mac重获新生，运行最新macOS系统

企业级AI落地的现实检验：从POC到价值闭环的七道工序

GNN实战避坑指南：消息传递、图同构与异构建模

医疗AI落地实战：心血管风险预警的可解释机器学习方案

双增强双塔模型：解决跨塔交互缺失与类目失衡的工业级推荐方案

Penpot云原生设计平台：基于分层抽象架构的分布式系统深度解析

Java毕设选题推荐：基于 Spring Boot 的个人随笔博客运维管理系统的设计与实现 基于 Spring Boot 的用户原创博客分享社区【附源码、mysql、文档、调试+代码讲解+全bao等】

【IC】【Low Power】从功耗构成到设计实践：CMOS低功耗技术全景解析

跨平台音乐播放神器：LX Music桌面版一站式解决多平台音乐聚合难题

音乐文件解锁实战指南：3个场景解决你的播放困境

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

Java毕设选题推荐：基于 Spring Boot 的个人随笔博客运维管理系统的设计与实现基于 Spring Boot 的用户原创博客分享社区【附源码、mysql、文档、调试+代码讲解+全bao等】