神经网络与深度学习课程总结二

发布时间：2026/5/25 7:39:09

第四部分下经典卷积神经网络进阶随着计算能力GPU的提升和海量数据如 ImageNet的出现深度卷积神经网络在传统的 LeNet 基础上迎来了爆发演生出了一系列更深、更强大的网络架构。以下是三种具有里程碑意义的经典网络总结一、 AlexNet (2012年 ImageNet 冠军)AlexNet 证明了深层卷积神经网络在复杂图像分类百万级高分辨率图像、1000个类别上的巨大潜力。它的网络结构包含 5 层卷积层和 3 层全连接层参数量达到了惊人的约 6000 万。核心改进与创新引入 ReLU 激活函数替代了传统的 Sigmoid 或 Tanh 函数有效缓解了梯度消失问题大幅提升了网络的收敛速度。最大池化Max Pooling全面采用有重叠的最大池化操作代替平均池化能够更好地保留图像中显著的纹理和边缘特征。Dropout 正则化在全连接层中以一定的概率$p$随机“关闭”部分神经元强制网络学习更加独立和鲁棒的特征极大减轻了庞大参数带来的过拟合问题。数据增强Data Augmentation通过平移、随机裁剪Crop、水平翻转Flip、以及色彩扰动Color Jittering等方式极大地扩充了训练集数据量。双 GPU 并行训练创新性地使用两块 GPU 协同训练并限制它们仅在特定的层进行通信。二、 VGG-16 (2014年)VGG 网络将“深度”推向了全新的高度16-19层其核心理念是证明了更深的网络能够提取更丰富、更优异的特征。核心设计理念与普遍规律极致规整的微小卷积核抛弃了 AlexNet 中较大的卷积核如全部采用极小的卷积核步长为1并使用 same padding 以保持特征图大小。“按比例翻倍”的设计原则* 对于输出特征图尺寸相同的层保持相同数量的滤波器。每经过一次池化层导致特征图空间尺寸长宽减半时滤波器通道的数量直接翻倍。这保证了网络每一层的时间复杂度大致相同。特点与代价网络结构异常简洁优美特征提取能力极强。但代价是参数量极其庞大高达 1.38 亿且绝大部分参数集中在第一个全连接层。三、 ResNet 残差网络 (2015年)随着网络层数不断加深研究者发现了一个违背直觉的“网络退化Degradation”问题56 层的普通网络在训练集和测试集上的误差竟然都比 20 层网络还要高。这并不是因为过拟合而是由极深网络带来的梯度消失引起的。核心创新残差块Residual Block与捷径连接Shortcut / Skip Connection捷径连接ResNet 引入了一条跨越一到两层的捷径将前一层的输入 $x$ 直接传递并加到后面的输出端。拟合残差网络的映射从拟合原本的完整目标函数转变为拟合残差。最终的非线性激活输出变为为何有效如果网络中某一层已经达到了最优表示即无需额外的非线性变换网络只需要将该层残差的权重逼近于 0即可通过捷径轻松实现恒等映射Identity Mapping。巨大优势这种结构直接为梯度回传打通了“高速公路”彻底解决了深层网络的梯度消失顽疾。它使得训练成百上千层如 ResNet-50, ResNet-101, ResNet-152的极深网络成为现实并且其计算复杂度FLOPs甚至远低于结构较浅的 VGG 网络。第五部分深度学习视觉应用在掌握了卷积神经网络CNN的基础架构之后本周课程正式进入了深度学习在计算机视觉领域的实际应用重点探讨了目标检测任务及其主流算法。一、计算机视觉常用数据集数据是驱动深度学习的核心。课程首先介绍了视觉领域几个具有里程碑意义的基础数据集MNIST内容包含 0~9 的手写数字灰度图像。地位深度学习的“Hello World”常用于验证算法的基础有效性。PASCAL VOC内容包含 20 个常见类别的真实场景图像。任务提供了图像分类、目标检测、图像分割等任务的标准标注。MS COCO (Microsoft Common Objects in Context)内容大规模的目标检测、分割和图像描述数据集包含复杂的日常场景。特点目标数量多、尺寸变化大、存在严重遮挡是目前检验目标检测算法性能最权威的标尺。ImageNet内容包含超过 1400 万张图像、1000 个类别的庞大数据库。地位ILSVRC 竞赛的数据基础直接推动了 AlexNet、VGG、ResNet 等经典网络的诞生。二、目标检测任务的核心评价指标与单纯的“图像分类Image Classification”不同“目标检测Object Detection”不仅需要知道图像中“有什么分类”还需要知道它们“在哪里定位”。因此需要一套更为严谨的评价指标。1. 基础指标Precision精确率与 Recall召回率Precision精确率模型预测为正样本的框中真正是正样本的比例。即“找得对不对”Recall召回率所有的真实正样本中被模型成功预测出来的比例。即“找得全不全”注两者往往是相互制约的提高召回率通常会导致精确率下降。2. P-R 曲线与 APAverage Precision平均精度P-R 曲线以 Recall 为横坐标Precision 为纵坐标绘制的曲线展示了模型在不同置信度阈值下的表现。AP 计算AP 的值即为P-R 曲线下方的面积。面积越接近 1说明该模型在当前类别上的检测性能越好。3. mAPmean Average Precision平均精度均值实际的目标检测任务往往包含多个类别。计算方法对所有类别的 AP 值求算术平均。地位mAP 是衡量目标检测模型综合性能最核心、最直观的指标。三、目标检测与 YOLO 算法传统的目标检测算法如 R-CNN 系列的“两阶段”算法通常先提取候选区域Region Proposals再进行分类速度较慢。而YOLOYou Only Look Once开创了“单阶段One-Stage”检测的先河。1. YOLO 的核心思想将检测转化为回归问题YOLO 放弃了繁琐的候选区域提取步骤直接将目标检测任务看作是一个单一的空间空间回归问题Regression Problem。只需要将图像输入神经网络一次Only Look Once就能直接在输出层同时得到所有目标的边界框坐标Bounding Boxes以及它们对应的类别概率Class Probabilities。2. YOLO 的基本工作流程网格划分将输入图像划分成的网格Grid。网格职责如果某个目标的中心点落在了某个网格内该网格就负责预测这个目标。输出预测每个网格需要预测个边界框包含中心坐标和宽高每个框的置信度Confidence以及个类别的条件概率。后处理使用NMS非极大值抑制Non-Maximum Suppression算法去除对同一目标的重复预测框保留得分最高的边界框。3. YOLO 的优缺点总结优点极速Fast由于是单阶段网络没有复杂的提交流程检测速度极快能够满足实时检测需求。全局视野在预测时能够利用全图的上下文信息背景误检率False Positives相对较低。缺点对密集的小目标检测效果较差因为一个网格通常只能预测有限数量的目标。边界框的定位精度不如两阶段算法如 Faster R-CNN。

华硕笔记本终极性能解放：如何用G-Helper实现轻量级硬件控制

华硕笔记本终极性能解放：如何用G-Helper实现轻量级硬件控制【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Zenboo…

2026/5/25 7:39:09 阅读更多

LLM安全防护：JavelinGuard架构与提示注入防御实践

1. 项目背景与核心挑战在当今AI技术快速发展的背景下，大型语言模型(LLM)已广泛应用于各类生产环境，从代码辅助到客服聊天机器人。然而，这些强大的模型也面临着严峻的安全挑战——恶意用户通过精心设计的提示词(prompt)可以绕过模型的安全限制…

2026/5/25 7:38:09 阅读更多

Arm架构浮点运算原理与优化实践

1. Arm架构浮点运算基础解析在处理器架构设计中，浮点运算能力是衡量计算性能的关键指标之一。Arm架构从v7到v9版本持续演进，其浮点处理子系统已经发展成为支持从嵌入式到高性能计算的完整解决方案。与x86架构不同，Arm采用分离的SIMD&FP寄…

2026/5/25 7:38:09 阅读更多

Chiseling方法：高效精准识别治疗优势亚组的统计推断框架

1. 亚组选择：从“一刀切”到“量体裁衣”的必然之路在药物研发和临床实践中，我们长期面临一个核心矛盾：一种新疗法在整体人群的随机对照试验中可能只显示出微弱甚至不显著的疗效，但这背后，是否隐藏着一部分对治疗反应极…

2026/5/25 8:27:13 阅读更多

手机号码定位技术：从查询到地图可视化的完整解决方案

手机号码定位技术：从查询到地图可视化的完整解决方案【免费下载链接】location-to-phone-number This a project to search a location of a specified phone number, and locate the map to the phone number location. 项目地址: https://gitcode.com/gh_mirro…

2026/5/25 8:27:13 阅读更多

Unity与Android Studio协同开发实战指南

1. 为什么Unity和Android Studio必须“联手”，而不是单打独斗？在Unity项目做到中后期，你大概率会遇到这样一个时刻：UI动效需要原生级流畅度、支付流程必须接入某家银行的SDK、人脸识别要调用系统级Camera API、或者后台服务需要保…

2026/5/25 8:24:10 阅读更多

隐式Ewald求和：机器学习原子间势中长程力建模的新范式

1. 项目概述：当机器学习原子间势遇上长程力在分子模拟和材料设计的日常工作中，我们这些“炼丹师”最头疼的问题之一，就是如何在保证计算效率的前提下，准确地描述原子间的相互作用。传统的量子力学方法，比如密度泛函理论…

2026/5/25 8:24:10 阅读更多

告别折腾！用DKMS一劳永逸管理你的水星MW310UH在Ubuntu 22.04上的驱动

告别折腾！用DKMS一劳永逸管理你的水星MW310UH在Ubuntu 22.04上的驱动每次内核更新后都要重新编译无线网卡驱动？这种重复劳动该终结了。对于使用水星MW310UH这类Realtek芯片设备的用户来说，DKMS（Dynamic Kernel Module Support&…

2026/5/25 8:23:09 阅读更多

fail2ban日志地理标签实战：MaxMind本地库+GeoLite2威胁溯源

1. 这不是“加个地图插件”那么简单：为什么地理标签是日志分析的临门一脚你有没有翻过服务器的/var/log/auth.log或 Nginx 的error.log？密密麻麻全是 IP 地址、时间戳、失败原因——Failed password for root from 192.168.3.11 port 54212 ssh2&#xf…

2026/5/25 8:21:27 阅读更多

Go语言SQLite轻量级数据库应用

Go语言SQLite轻量级数据库应用引言 SQLite是一款轻量级的嵌入式数据库，无需独立服务进程，非常适合单机应用、移动端应用和开发测试环境。Go语言通过database/sql包配合go-sqlite3驱动可以方便地操作SQLite数据库。本文将深入探讨Go语言中SQLite的使用技…

2026/5/25 0:01:30 阅读更多

【前端无障碍】屏幕阅读器兼容性：确保视障用户的良好体验

【前端无障碍】屏幕阅读器兼容性：确保视障用户的良好体验前言大家好，我是cannonmonster01！今天咱们来聊聊屏幕阅读器兼容性这个话题。想象一下，一个视障用户打开你的网站，通过屏幕阅读器来浏览内容。如果你的网站没有…

2026/5/25 0:02:31 阅读更多

2026年横评10款降AI率软件:只选真正管用的那一款！

随着AI写作工具的广泛应用，论文写作和内容创作效率得到了显著提升，许多学生和职场人士都开始依赖这些工具来完成繁重的文字任务。然而，随着各大高校、期刊平台对AIGC内容检测技术的不断升级，AI生成内容的痕迹越来越容易被识别。不…

2026/5/25 0:04:13 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/25 1:05:07 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/25 1:05:13 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/25 1:05:14 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/24 15:30:50 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/24 15:03:26 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/24 9:50:45 阅读更多

相关文章