YOLO v7（学习笔记）

发布时间：2026/7/2 16:07:24

1.简介主要改进现有的一些trick的集合以及模块重参化和动态标签分配策略最终在 5 FPS 到 160 FPS 范围内的速度和准确度都超过了所有已知的目标检测器。当前目标检测主要的优化方向更快更强的网络架构更有效的特征集成方法更准确的检测方法更精确的损失函数更有效的标签分配方法更有效的训练方法。2.网络结构1input整体复用YOLO V5的预处理方式和相关源码唯一需要注意的是官方主要是在640×640和1280×1280这样的相对较大的图片上进行的训练和测试。2backbone主要是使用ELAN该版本模型并没有使用论文里提到的最复杂的E-ELAN结构和 MP 结构。该版本模型的激活函数使用的是Silu。a.ELAN结构通过控制最短最长的梯度路径更深的网络可以有效地学习和收敛。作者提出ELAN结构。基于ELAN设计的E-ELAN 用expand、shuffle、merge cardinality来实现在不破坏原有梯度路径的情况下不断增强网络学习能力的能力。论文中相关的图如下其中的cross stage connection 其实就是1×1卷积简化如下MP 结构需要注意backbone中的MP前后通道数是不变的。3neck head检测头整体结构和YOLOV5类似仍然是anchor based 结构仍然没有使用YOLOX 和YOLOV6 的解耦头分类和检测思路。3.损失函数整体和YOLOV5 保持一致分为坐标损失、目标置信度损失GT就是训练阶段的普通iou和分类损失三部分。其中目标置信度损失和分类损失采用BCEWithLogitsLoss带log的二值交叉熵损失坐标损失采用CIoU损失。4.样本匹配策略主要是参考了YOLOV5 和YOLOV6使用的当下比较火的simOTA.训练前会基于训练集中gt框通过k-means聚类算法先验获得9个从小到大排列的anchor框。(可选)将每个gt与9个anchor匹配Yolov5为分别计算它与9种anchor的宽与宽的比值较大的宽除以较小的宽比值大于1下面的高同样操作、高与高的比值在宽比值、高比值这2个比值中取最大的一个比值若这个比值小于设定的比值阈值这个anchor的预测框就被称为正样本。一个gt可能与几个anchor均能匹配上此时最大9个。所以一个gt可能在不同的网络层上做预测训练大大增加了正样本的数量当然也会出现gt与所有anchor都匹配不上的情况这样gt就会被当成背景不参与训练说明anchor框尺寸设计的不好。扩充正样本。根据gt框的中心位置将最近的2个邻域网格也作为预测网格也即一个groundtruth框可以由3个网格来预测可以发现粗略估计正样本数相比前yolo系列增加了三倍此时最大27个匹配。图下图浅黄色区域其中实线是YOLO的真实网格虚线是将一个网格四等分如这个例子中GT的中心在右下虚线网格则扩充右和下真实网格也作为正样本。获取与当前gt有top10最大iou的prediction结果。将这top10 5-15之间均可并不敏感iou进行sum就为当前gt的k。k最小取1。根据损失函数计算每个GT和候选anchor损失前期会加大分类损失权重后面减低分类损失权重如1:5-1:3并保留损失最小的前K个。去掉同一个anchor被分配到多个GT的情况。

如何快速掌握船舶设计：FREE!ship Plus的完整实战指南

如何快速掌握船舶设计：FREE!ship Plus的完整实战指南【免费下载链接】freeship-plus-in-lazarus FreeShip Plus in Lazarus 项目地址: https://gitcode.com/gh_mirrors/fr/freeship-plus-in-lazarus 想要从零开始学习船舶设计却不知如何入手？FRE…

2026/7/1 3:15:31 阅读更多

多Agent讨论机制原理

多Agent讨论机制原理概述多Agent讨论机制是AutoAgent系统的核心协作能力之一，它模拟人类团队协作的方式，让多个AI Agent围绕特定主题进行结构化讨论，最终达成共识或生成高质量的决策结果。设计目标模拟人类协作：模仿真实团队讨论的模式，包括轮流发言、专家主导、辩…

2026/6/23 15:16:13 阅读更多

OpenClaw 一键卸载工具自动备份恢复免费下载一行命令完事

工具获取:www.365ym.com/soft/3040.html下面是子系统卸载教程，windows端同理第一步，在子系统cd到卸载工具目录下输入这个命令python3 uninstaller.py第二步，选择1，2，3的卸载方式

2026/6/30 12:32:37 阅读更多

ICM-42605与MK20微控制器的6DOF运动追踪方案

1. 项目背景与硬件选型解析在工业自动化、无人机导航和VR交互等领域，精确追踪物体在三维空间中的运动轨迹和方向一直是个经典难题。传统方案要么成本高昂（如光学动捕系统），要么精度不足（如单纯依赖加速度计&#xff09…

2026/7/2 16:07:08 阅读更多

一站式智能激活解决方案：全面解决Windows和Office授权管理难题

一站式智能激活解决方案：全面解决Windows和Office授权管理难题【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows系统和Office办公软件的激活问题而烦恼吗？KM…

2026/7/2 16:07:08 阅读更多

6DoF运动追踪：IMU与MCU硬件实现与姿态解算

1. 从3D到6DoF：IMU与MCU的硬件实现方案在运动追踪和空间定位领域，6自由度（6DoF）是一个关键指标。相比传统的3D空间定位，6DoF增加了三个旋转自由度的感知能力，使得设备能够完整还原物体在三维空间中的运动状…

2026/7/2 16:06:47 阅读更多

IMU传感器与6DoF姿态追踪技术解析

1. 从3D到6DoF：IMU传感器的进阶之路在三维空间定位与姿态追踪领域，IIM-42652这款六轴IMU（惯性测量单元）与PIC18F2585微控制器的组合，为开发者提供了一套高性价比的硬件解决方案。我曾在一个工业机械臂项目中采用这套方…

2026/7/2 16:06:27 阅读更多

备份不该是负担，养成随手存一份的习惯有多重要

重要文件丢失的教训往往来得猝不及防。电脑硬盘突然罢工、系统更新后文件丢失、误操作把辛苦整理的项目文件夹清空，这些事情在现实中发生的概率远比想象中高。很多人直到遭遇一次数据损失之后，才开始重视备份这件事。但真到要养成定期备份的习惯时&#…

2026/7/2 16:05:26 阅读更多

IMU与MCU协同设计：6DoF运动追踪方案

1. 从3D到6DoF：IMU与MCU的硬件协同设计在运动追踪和空间定位领域，3D（三维空间）到6DoF（六自由度）的跨越代表着从简单的位置感知到完整姿态解算的质变。IIM-42652作为TDK InvenSense新一代工业级IMU&#xff…

2026/7/2 16:05:06 阅读更多

Selenium元素定位全解析：从八大方法到实战策略

1. 项目概述：从“找东西”到“精准操控” 做自动化测试，尤其是Web UI自动化，最核心也最让人头疼的一步是什么？不是写复杂的业务逻辑，也不是处理异步加载，而是最基础的—— 让程序找到页面上那个你想操作的…

2026/7/2 0:00:12 阅读更多

移动端UI自动化测试框架Maestro终极指南：从入门到实战

1. 项目概述：为什么是Maestro？ 如果你正在寻找一个能让你快速上手、告别繁琐配置、并且对移动端UI自动化测试真正友好的框架，那么Maestro很可能就是你一直在等的那个答案。我接触过Appium、Espresso、XCUITest，也折腾过各种基于图…

2026/7/2 0:00:12 阅读更多

BurpSuite Cluster Bomb模式深度避坑指南：从原理到实战的完整爆破策略

1. 项目概述：从“能用”到“精通”的必经之路如果你正在学习或从事网络安全测试，尤其是Web应用安全评估，那么BurpSuite的Intruder模块绝对是你绕不开的核心工具。而Intruder模块里，功能最强大、也最让人又爱又恨的，莫过…

2026/7/2 0:00:33 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/2 0:09:58 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/7/2 1:54:44 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/7/2 1:54:44 阅读更多

FAE放射组学分析工具：医学影像特征探索的完整解决方案

FAE放射组学分析工具：医学影像特征探索的完整解决方案【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE 你是否曾经面对海量医学影像数据感到无从下手？想要从CT、MRI等影像中提取有价值的定量特征&#…

2026/7/2 0:02:27 阅读更多

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南【免费下载链接】happy-llm 📚 从零开始构建大模型项目地址: https://gitcode.com/GitHub_Trending/ha/happy-llm 还在为大型多模态模型动辄数十亿参数、显存占用高而烦恼&…

2026/7/2 0:10:02 阅读更多

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址…