PaddleLabel标注注意事项_完整版

发布时间：2026/6/6 20:30:38

文章目录1.数据标注1.1 数据标注要点2.数据验证2.1 格式验证及修改2.2 PaddleX数据验证1.数据标注1.1 数据标注要点1倾斜框处理。倾斜 / 旋转字符必须画倾斜四边形框不能画正矩形否则矫正后会变形。2) 多点标注顺序。对于倾斜字符需要用多点标注按键盘 Q 进入四点模式顺序为顺时针 / 逆时针左上→右上→右下→左下框要完整包围字符区域并保留少量边缘空白避免裁剪到字符边缘。多边形框必须是凸的。3英文字符格式。如果训练英文字符标签必须使用英文输入法下的半角字符。如果字典my_dict.txt里只有半角字符模型遇到全角字符会报未知字符错误导致训练失败。例如模型无法学会“全角A”和“半角A”其实是同一个意思导致识别率低。4空格处理。如果图片文本本身就包含明显的空格分隔那么标注时就必须加上空格。如果没有空格请注意输入字符时不要有空格PaddleOCR 不会自动忽略空格它会把“有空格”和“无空格”视为两个完全不同的文本。因此标注必须和实际预测时的输入/输出需求保持一致。如果图文为了美观让数字之间呈现空格则在标注的时候需要把空格去掉。如果保留了空格必须确保你的字典文件ppocr_keys_v1.txt 或自定义字典中包含空格字符否则模型会把空格识别为他乱码。5特殊字符#、、|、●要添加到自定义字典。6同一行中大小不一的字符要分开标注。7无法识别区域标记为 ###。8在windows系统下上传标签label.txt) 文件到算力平台需要整个文件上传不要粘贴复制在粘贴复制过程中数据格式会发生转变导致模型会跳过不符合格式的数据。2.数据验证2.1 格式验证及修改1以下代码会判断多边形标注的数据label.txt与rec_gt.txt是否符合要求并修改不合格的数据使得每行数据统一使用Tab分隔。importjsonimportosdefget_polygon_area(points):使用鞋带公式计算多边形面积用于判断顺/逆时针及自相交area0.0nlen(points)foriinrange(n):j(i1)%n areapoints[i][0]*points[j][1]area-points[j][0]*points[i][1]returnarea/2.0deforder_points_clockwise(pts):将四个点强制矫正为标准的顺时针顺序左上-右上-右下-左下# 1. 按 y 坐标排序分出上下两对点sorted_by_ysorted(pts,keylambdax:x[1])top_twosorted_by_y[:2]bottom_twosorted_by_y[2:]# 2. 上方两点按 x 排序分出左上和右上top_two_sortedsorted(top_two,keylambdax:x[0])tl,trtop_two_sorted[0],top_two_sorted[1]# 3. 下方两点按 x 排序分出左下和右下bottom_two_sortedsorted(bottom_two,keylambdax:x[0])bl,brbottom_two_sorted[0],bottom_two_sorted[1]# 返回标准的顺时针顺序return[tl,tr,br,bl]defvalidate_and_fix_points(points):校验并矫正四点框iflen(points)!4:returnpoints,False,点数不为4# 计算面积如果面积 0说明是逆时针或自相交凹四边形areaget_polygon_area(points)is_clockwise_convexarea0ifis_clockwise_convex:returnpoints,True,原始合规else:# 自动矫正重排为标准的左上-右上-右下-左下fixed_pointsorder_points_clockwise(points)returnfixed_points,False,顺序/形状不合规自动矫正input_filerC:\Users\ls\Desktop\tmp\MY_val .txtok_filerC:\Users\ls\Desktop\tmp\MY_val_OK.txtng_filerC:\Users\ls\Desktop\tmp\MY_val_NG.txtlog_filerC:\Users\ls\Desktop\tmp\MY_val_judge_result.txtwithopen(input_file,r,encodingutf-8)asf_in,open(ok_file,w,encodingutf-8)asf_ok,open(ng_file,w,encodingutf-8)asf_ng,open(log_file,w,encodingutf-8)asf_log:forlineinf_in:lineline.strip()ifnotline:continue# 兼容空格或Tab分隔提取图片名和JSON字符串partsline.split(None,1)iflen(parts)!2:continueimg_name,json_strpartstry:# 解析标注的JSON列表labelsjson.loads(json_str)new_labels[]log_notes[]has_ngFalseforlabelinlabels:original_pointslabel[points]fixed_points,is_valid,notevalidate_and_fix_points(original_points)ifnotis_valid:has_ngTrue# 更新矫正后的坐标label[points]fixed_points new_labels.append(label)log_notes.append(note)# 1. 写入全部合规数据MY_train_ok.txt统一使用Tab分隔f_ok.write(f{img_name}\t{json.dumps(new_labels,ensure_asciiFalse)}\n)# 2. 写入不合规的原始数据及修改后的框MY_train_ng.txtifhas_ng:f_ng.write(f原始{line}\n)f_ng.write(f修改{img_name}\t{json.dumps(new_labels,ensure_asciiFalse)}\n\n)# 3. 写入校验日志judge_result.txtnote_summary; .join(log_notes)f_log.write(f{img_name}{json_str}{合规ifnothas_ngelse不合规}{json.dumps(new_labels,ensure_asciiFalse)}{note_summary}\n)exceptExceptionase:print(f处理行出错:{line}, 错误:{e})print(✅ 校验与矫正完成已生成 MY_train_ok.txt, MY_train_ng.txt, judge_result.txt)2创建convert.py 脚本批量将所有全角字母、数字和符号转换为对应的半角字符。importunicodedata input_filerec_gt.txtoutput_filerec_gt_halfwidth.txtwithopen(input_file,r,encodingutf-8)asf_in,\open(output_file,w,encodingutf-8)asf_out:forlineinf_in:# 使用 NFKC 规范化将全角字符转换为半角normalized_lineunicodedata.normalize(NFKC,line)f_out.write(normalized_line)print(f转换完成已将半角文件保存为:{output_file})2.2 PaddleX数据验证默认已安装paddleX校验数据1PPOCRV5检测模型数据目录--data-- images -- train.txt -- val.txt检测模型数据集验证python PaddleX-release-3.5/main.py-cPaddleX-release-3.5/paddlex/configs/modules/text_detection/PP-OCRv5_mobile_det.yaml-oGlobal.modecheck_dataset-oGlobal.dataset_dirdataset/train_data/det2PPOCRV5识别模型数据目录--data-- images -- train.txt -- val.txt -- dict.txt识别模型数据集验证python PaddleX-release-3.5/main.py-cpaddlex/configs/modules/text_recognition/PP-OCRv4_mobile_rec.yaml-oGlobal.modecheck_dataset-oGlobal.dataset_dir/root/dataset/train_rec如果数据集格式合格会显示Check dataset passed !

报名｜ACL‘26 美团中稿精选：从能力评测到推理优化，构建生成新范式

ACL（Annual Meeting of the Association for Computational Linguistics）是计算语言学和自然语言处理（NLP）领域的国际顶级学术会议。自 1962 年创办以来，ACL 已成为 NLP 领域规模最大、影响力最高的学术盛会&#xff0…

2026/6/6 20:30:38 阅读更多

新型消费积分商业模式拆解：盈利架构、衰减铸造模型与项目风控要点

东西买完很开心。几天后看账单，还是觉得——钱又没了。消费这件事，好像永远是单向的。但最近一两年，一种叫"绿色积分"的模式，正在悄悄改写这个逻辑。不讲政策原文。只说操盘手真正关心的三件事——参数怎么设、节奏怎么…

2026/6/6 20:29:16 阅读更多

AI赋能：利用快马多模型为wechatmsg消息处理注入智能灵魂

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 请生成一个集成AI能力的智能微信消息处理应用，要求：1、调用快马平台支持的AI模型（如DeepSeek），对收到的长文本消息或文章…

2026/6/6 20:29:15 阅读更多

STM32项目避坑：IWDG喂狗不当引发的“灵异”复位，你的HAL_IWDG_Refresh放对地方了吗？

STM32项目避坑：IWDG喂狗不当引发的“灵异”复位，你的HAL_IWDG_Refresh放对地方了吗？在嵌入式开发中，看门狗定时器（IWDG）是确保系统可靠性的重要机制。然而，许多开发者在使用STM32的HAL库时&…

2026/6/6 21:39:22 阅读更多

解决Minecraft启动器PCL窗口不显示问题：管理员权限的奥秘与实用技巧

解决Minecraft启动器PCL窗口不显示问题：管理员权限的奥秘与实用技巧【免费下载链接】PCL Minecraft 启动器 Plain Craft Launcher（PCL）。项目地址: https://gitcode.com/gh_mirrors/pc/PCL Plain Craft Launcher (PCL) 是一款广受欢…

2026/6/6 21:39:01 阅读更多

告别重复造轮子：用快马ai一键生成arm7常用外设驱动模块

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 我正在开发一个基于arm7的项目，需要快速集成几个常用外设驱动以提升效率。请生成一个集成了以下功能的arm7模块化代码：一、uart串口通信初始化函数及发送接…

2026/6/6 21:38:41 阅读更多

STM32驱动1602 LCD：从硬件连接到软件驱动的完整实战指南

1. 项目概述与1602 LCD基础认知在嵌入式开发中，尤其是基于STM32这类MCU的项目里，人机交互界面（HMI）是连接用户与设备的关键桥梁。对于需要显示简单文本、数字或状态信息的应用，1602字符型液晶显示器（LCD&am…

2026/6/6 21:38:20 阅读更多

CSDN AI营销卡片数量红线曝光：超过这个数，不仅不引流，还拉低推荐分！

更多请点击： https://intelliparadigm.com 第一章：CSDN AI营销卡片数量红线的官方定义与底层逻辑 CSDN 官方对 AI 营销卡片的数量红线作出明确界定：单篇技术文章中嵌入的 AI 营销卡片（含“AI 生成”“AI 辅助写作”“AI 检查建议…

2026/6/6 21:38:20 阅读更多

系统级 CLI 工具开发：基于 Rust 强大的 Clap 参数解析与自定义 anyhow 链式错误处理工程实践

系统级 CLI 工具开发：基于 Rust 强大的 Clap 参数解析与自定义 anyhow 链式错误处理工程实践在系统级开发与自动化运维中，命令行界面（CLI）工具是与用户、脚本以及操作系统底层交互的最核心通道。一个生产级的 CLI 工具&#xff0c…

2026/6/6 21:38:20 阅读更多

Windows下免安装凸轮轮廓生成工具：支持多种从动件与运动规律的本地化计算与DXF导出

本文还有配套的精品资源，点击获取简介：专为机械设计场景打造的便携式凸轮设计辅助工具，运行在Windows平台，无需安装、不写注册表、不联网，双击主程序即可启动。提供直动/摆动两类从动件类型（尖顶、滚子…

2026/6/6 0:00:44 阅读更多

DeepPCB数据集：3步构建高精度PCB缺陷检测AI系统

DeepPCB数据集：3步构建高精度PCB缺陷检测AI系统【免费下载链接】DeepPCB A PCB defect dataset. 项目地址: https://gitcode.com/gh_mirrors/de/DeepPCB 还在为PCB（印刷电路板）缺陷检测项目找不到高质量数据集而烦恼吗？面…

2026/6/6 0:01:04 阅读更多

Aimmy完全指南：5分钟掌握免费AI瞄准辅助工具，提升游戏操作体验

Aimmy完全指南：5分钟掌握免费AI瞄准辅助工具，提升游戏操作体验【免费下载链接】Aimmy Universal Second Eye for Gamers with Impairments (Universal AI Aim Aligner (AI Aimbot) - ONNX/YOLOv8 - C#) 项目地址: https://gitcode.com/gh_mirrors/ai/…

2026/6/6 0:04:06 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/6 9:33:43 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/6 8:10:10 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/6 9:33:50 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/6 9:33:50 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/6 9:33:47 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/6 9:33:47 阅读更多

相关文章

报名｜ACL‘26 美团中稿精选：从能力评测到推理优化，构建生成新范式

新型消费积分商业模式拆解：盈利架构、衰减铸造模型与项目风控要点

AI赋能：利用快马多模型为wechatmsg消息处理注入智能灵魂

STM32项目避坑：IWDG喂狗不当引发的“灵异”复位，你的HAL_IWDG_Refresh放对地方了吗？

解决Minecraft启动器PCL窗口不显示问题：管理员权限的奥秘与实用技巧

告别重复造轮子：用快马ai一键生成arm7常用外设驱动模块

STM32驱动1602 LCD：从硬件连接到软件驱动的完整实战指南

CSDN AI营销卡片数量红线曝光：超过这个数，不仅不引流，还拉低推荐分！

系统级 CLI 工具开发：基于 Rust 强大的 Clap 参数解析与自定义 anyhow 链式错误处理工程实践

Windows下免安装凸轮轮廓生成工具：支持多种从动件与运动规律的本地化计算与DXF导出

DeepPCB数据集：3步构建高精度PCB缺陷检测AI系统

Aimmy完全指南：5分钟掌握免费AI瞄准辅助工具，提升游戏操作体验

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因