用Python和YOLOv5给摄像头装上‘尺子’：一个杯子引发的单目测距实战

发布时间：2026/5/29 1:55:29

用Python和YOLOv5给摄像头装上‘尺子’一个杯子引发的单目测距实战当你手边只有一个普通的USB摄像头却想让它具备测量物体距离的超能力时单目测距技术就是你的魔法棒。这个看似高深的计算机视觉应用其实用生活中常见的物品比如一个马克杯就能轻松实现。本文将带你从零开始用Python和YOLOv5打造一个低成本、高趣味性的单目测距系统。1. 环境准备与工具选择在开始之前我们需要搭建一个稳定的开发环境。推荐使用Python 3.8或更高版本这个版本在兼容性和性能上都有不错的表现。以下是需要安装的核心库pip install torch torchvision opencv-python numpy matplotlib对于YOLOv5我们直接从官方仓库克隆最新版本git clone https://github.com/ultralytics/yolov5 cd yolov5 pip install -r requirements.txt注意如果使用GPU加速建议安装CUDA 11.3和对应版本的PyTorch以获得最佳性能。硬件方面任何一款支持USB3.0的1080p摄像头都能满足需求。我测试使用的是罗技C920但几十元的普通摄像头同样可以工作。关键在于标定过程的准确性而不是设备的高端程度。2. 摄像头标定用马克杯当标尺单目测距的核心在于理解相似三角形原理。我们需要先确定摄像头的焦距这个过程称为标定。具体步骤如下准备一个已知尺寸的物体如宽15cm的马克杯将物体放置在距离摄像头20cm处并拍照使用YOLOv5检测物体在图像中的像素宽度通过公式计算焦距焦距 (像素宽度 × 实际距离) / 实际宽度def calculate_focal_length(known_width, known_distance, pixel_width): return (pixel_width * known_distance) / known_width实际操作中建议拍摄多组不同距离的照片求取平均焦距值这样可以减少测量误差。下表展示了我用马克杯标定时的三组数据实际距离(cm)像素宽度(px)计算焦距(px)20320426.6725256426.6730213426.00可以看到三组数据计算出的焦距非常接近最终我们取平均值426.44px作为标定结果。这个值将作为后续所有距离计算的基础。3. 构建完整的测距流水线有了焦距参数我们就可以构建完整的测距系统了。系统工作流程分为三个主要步骤物体检测使用YOLOv5实时检测视频流中的目标物体像素测量获取物体在图像中的包围框宽度像素单位距离计算应用相似三角形原理转换像素距离为实际距离核心计算函数如下def calculate_distance(known_width, focal_length, pixel_width): return (known_width * focal_length) / pixel_width为了提高实用性我们可以添加一些增强功能多物体支持通过修改YOLOv5的输出处理可以同时测量多个物体的距离单位转换添加厘米/英寸的单位切换功能历史记录保存最近几次的测量结果用于对比分析一个完整的处理帧函数可能长这样def process_frame(frame, model, focal_length, known_width): # 使用YOLOv5进行物体检测 results model(frame) # 解析检测结果 detections results.pandas().xyxy[0] for _, det in detections.iterrows(): if det[name] cup: # 只处理目标类别 pixel_width det[xmax] - det[xmin] distance calculate_distance(known_width, focal_length, pixel_width) # 在图像上绘制结果 cv2.rectangle(frame, (int(det[xmin]), int(det[ymin])), (int(det[xmax]), int(det[ymax])), (0,255,0), 2) cv2.putText(frame, f{distance:.1f}cm, (int(det[xmin]), int(det[ymin])-10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0,255,0), 2) return frame4. 误差分析与优化策略在实际测试中我发现几个主要误差来源角度偏差当摄像头与物体不在同一水平面时测量结果会偏大镜头畸变普通摄像头的桶形畸变会影响边缘区域的测量精度标定误差初始焦距测量的准确性直接影响所有后续结果针对这些问题可以采用以下优化策略多角度标定法在不同角度拍摄标定物体建立角度-距离补偿模型ROI限制只使用图像中心区域进行测量减少镜头畸变影响移动平均滤波对连续视频帧的结果进行平滑处理# 简单的移动平均滤波实现 class DistanceFilter: def __init__(self, window_size5): self.window [] self.size window_size def update(self, value): self.window.append(value) if len(self.window) self.size: self.window.pop(0) return sum(self.window) / len(self.window)下表对比了优化前后的测量误差单位cm实际距离原始测量优化后测量30cm32.4cm30.8cm50cm56.7cm51.2cm70cm82.3cm72.6cm虽然误差随距离增加而增大但优化后的结果明显更接近真实值。对于日常使用场景这样的精度已经足够。5. 创意应用与扩展思路掌握了基础的单目测距技术后可以尝试许多有趣的扩展应用智能货架监控实时监测货架上商品的取放情况互动艺术装置根据观众距离变化产生不同的视觉效果简易3D扫描结合物体移动轨迹重建粗略的3D模型一个特别实用的扩展是距离警报系统当物体进入预设的危险距离时会发出警告def distance_alert(frame, distance, safe_distance50): if distance safe_distance: cv2.putText(frame, WARNING: Too close!, (50,50), cv2.FONT_HERSHEY_SIMPLEX, 1.5, (0,0,255), 3) # 可以添加声音报警 # import winsound # winsound.Beep(1000, 200) return frame在实现这些扩展功能时记得考虑以下几点性能优化对于实时应用可以考虑使用YOLOv5s等轻量级模型多线程处理将图像采集、处理和显示放在不同线程提高响应速度用户界面添加简单的GUI让非技术人员也能方便使用# 简单的多线程处理示例 import threading class VideoProcessor: def __init__(self): self.frame None self.running True def capture_thread(self): cap cv2.VideoCapture(0) while self.running: ret, self.frame cap.read() def process_thread(self): while self.running: if self.frame is not None: processed_frame process_frame(self.frame.copy()) cv2.imshow(Result, processed_frame) if cv2.waitKey(1) ord(q): self.running False6. 实战技巧与常见问题解决在实际开发过程中我总结了一些有价值的经验光照条件过强或过弱的光线都会影响检测精度建议在均匀光照环境下使用物体选择高对比度的纯色物体检测效果最好避免使用图案复杂的物品摄像头固定测量时保持摄像头稳定手持会导致结果波动遇到检测不稳定的情况时可以尝试以下调试步骤检查YOLOv5的置信度阈值默认0.25适当提高可减少误检验证标定过程是否正确特别是实际距离的测量要精确测试不同分辨率有时降低分辨率反而能提高检测稳定性# 调整YOLOv5的检测参数 model.conf 0.5 # 置信度阈值 model.iou 0.45 # IOU阈值对于想进一步深入学习的开发者推荐探索以下方向立体视觉尝试用两个摄像头实现更精确的测距深度学习训练自定义的物体检测模型提高特定场景的准确率传感器融合结合红外或超声波传感器提升系统鲁棒性在项目开发过程中版本控制也很重要。我习惯使用如下目录结构mono_distance/ ├── configs/ # 配置文件 ├── data/ # 测试图像和视频 ├── models/ # 训练好的模型 ├── utils/ # 工具函数 ├── main.py # 主程序 └── requirements.txt # 依赖库

从‘克莱因四元群’到‘复数旋转’：手把手带你验证两个群是否同构（附Python代码）

从‘克莱因四元群’到‘复数旋转’：手把手带你验证两个群是否同构（附Python代码）数学中的群论常被描述为"对称性的语言"，而同构则是连接不同群结构的桥梁。想象一下，你发现两个看似完全不同的数学对象——比…

2026/5/29 1:55:29 阅读更多

第16篇｜小艺意图配置：insight_intent.json 如何绑定执行器

这篇讲智能化能力如何进入项目，同时处理本地配置、请求结构、解析兜底和用户可见反馈。本篇主题是「小艺意图配置：insight_intent.json 如何绑定执行器」，目标是把源码、效果和工程质量放到同一篇文章里讲透。本文是 21 天「智能相机开发实战…

2026/5/29 1:55:09 阅读更多

基于Arduino Leonardo的辅助鼠标设计：用摇杆与PCB为手部受限者重塑交互

1. 项目概述：为手部受限者重塑鼠标交互在数字时代，电脑操作已成为许多人日常工作与生活不可或缺的一部分。然而，对于患有类风湿关节炎等手部活动受限的用户而言，一个看似简单的点击、拖拽动作，都可能伴随着关节疼痛、僵…

2026/5/29 1:54:28 阅读更多

从FPN到BiFPN：聊聊目标检测中特征金字塔的那些“坑”与优化思路

从FPN到BiFPN：目标检测中特征金字塔的演进与实战解析在计算机视觉领域，目标检测任务面临着多尺度物体识别的核心挑战。当算法需要同时处理近处清晰的大目标和远处模糊的小目标时，传统单尺度特征提取方法往往捉襟见肘。特征金字塔网络(FPN)的提…

2026/5/29 2:44:03 阅读更多

SAP CS20批量改BOM翻车实录：一个‘工程变更管理’开关引发的血案

SAP CS20批量修改BOM实战：从报错排查到工程变更管理的深度解析当生产线上的工艺改进需要同步更新数百个产品的BOM结构时，CS20事务码就像是一把双刃剑——用好了能极大提升效率，用不好则可能引发连锁反应。最近我就遇到了这样一个典型案例&am…

2026/5/29 2:44:03 阅读更多

SAP ABAP开发实战：用GN_DELIVERY_CREATE和BAPI_INB_DELIVERY_CHANGE搞定内部交货单（附完整代码）

SAP ABAP实战：GN_DELIVERY_CREATE与BAPI_INB_DELIVERY_CHANGE在内部交货单开发中的深度应用当企业供应链系统需要处理跨仓库调拨或生产补料时，内部交货单（Inbound Delivery）的高效创建与修改直接影响物流效率。作为ABAP开发者&am…

2026/5/29 2:43:23 阅读更多

数据结构树

makefileMakefile 是一个自动化编译工具的控制文件，用于管理程序的编译和链接过程。它定义了源文件之间的依赖关系，并指定如何编译和链接程序。通过 make 命令执行 Makefile 中的指令。只重新编译修改过的文件，避免重复编译自动化复杂的编译过…

2026/5/29 2:43:23 阅读更多

GBFR Logs：将《碧蓝幻想：RELINK》战斗数据转化为你的制胜策略

GBFR Logs：将《碧蓝幻想：RELINK》战斗数据转化为你的制胜策略【免费下载链接】gbfr-logs GBFR Logs lets you track damage statistics with a nice overlay DPS meter for Granblue Fantasy: Relink. 项目地址: https://gitcode.com/gh_mirrors/gb/g…

2026/5/29 2:42:02 阅读更多

从ADSL到光纤：家庭宽带升级史，以及那些被遗忘的HFC和xDSL技术

从铜线到光缆：家庭宽带技术演进与底层原理深度解析记得2006年第一次在家安装宽带时，工程师带来的那个银色ADSL Modem让我充满好奇——为什么上网时电话还能正常使用？这个疑问伴随我进入通信行业，也让我亲历了从ADSL到光纤的技术革…

2026/5/29 2:42:02 阅读更多

PostgreSQL Vacuum介绍（一种核心数据库维护操作，主要用于解决MVCC多版本并发控制机制带来的死元组dead tuples问题）回收死元组空间、存储空间耗尽、避免幻读、垃圾回收器

文章目录**为什么需要 Vacuum？****Vacuum 的核心作用****实际场景中的关键点****简单总结**在 PostgreSQL 中， Vacuum 是一种核心的数据库维护操作，主要用于解决 MVCC（多版本并发控制）机制带来的“死元组&#xff0…

2026/5/29 0:01:04 阅读更多

从零设计可调光LED夜灯：NE555 PWM电路全流程实战指南

1. 项目概述：为什么电路设计是每个创客的必修课如果你对电子制作感兴趣，无论是想做一个会发光的徽章，还是一个能自动浇花的小装置，你都会发现，所有想法最终都要落到一块小小的电路板上。电路设计，就是连接创…

2026/5/29 0:04:48 阅读更多

基于Arduino的动漫角色机械面制作：从传感器到伺服电机的交互实现

1. 项目概述：从动漫角色到可交互的机械面我一直对如何让静态的模型“活”起来充满兴趣，特别是那些我们熟悉的动漫角色。这次，我决定挑战自己，制作一个基于《火影忍者》中宇智波佐助的机械面。这个项目的核心目标很简单&#xff1a…

2026/5/29 0:04:48 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/28 4:33:02 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/28 3:32:24 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/28 3:32:25 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/28 20:29:33 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/28 17:40:02 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/28 13:05:45 阅读更多

相关文章