常见激活函数之ReLU激活函数

发布时间：2026/6/28 3:17:45

ReLU是目前深度学习中最常用、最基础的激活函数广泛用于卷积神经网络CNN和全连接层中。1. 数学公式ReLU 的数学表达式非常简单ReLU(x)max⁡(0,x) \text{ReLU}(x) \max(0, x)ReLU(x)max(0,x)也就是说当输入x0x 0x0时输出等于输入xxx。当输入x≤0x \le 0x≤0时输出等于000。2. 几何特征与性质输出范围[0,∞)[0, \infty)[0,∞)。形状在坐标系中它是一条在原点处“折断”的折线。左半部分贴着 x 轴y0右半部分是一条斜率为 1 的直线yx。非线性虽然它看起来像线性函数但因为在x0x0x0处的拐折它整体是非线性的。这一点至关重要正是这个非线性使得神经网络能够学习复杂的非线性映射。如果它完全是线性的那么多层神经网络叠加起来依然等效于单层失去了深度的意义。3. 导数梯度在反向传播中ReLU 的导数同样极其简单ReLU′(x){1,x00,x≤0 \text{ReLU}(x) \begin{cases} 1, x 0 \\ 0, x \le 0 \end{cases}ReLU′(x){1,0,x0x≤0当x0x 0x0时梯度恒为1。当x≤0x \le 0x≤0时梯度为0。(注在x0x0x0处严格来说是不可导的但在代码实现中通常将其归为 0 或 1不影响实际训练。结尾专门有补充这部分的内容)4. ReLU 的变体为了解决“死亡 ReLU”为了克服死亡 ReLU 和非零中心化的问题人们提出了许多 ReLU 的变体Leaky ReLU带泄漏的 ReLU公式f(x){x,x0αx,x≤0f(x) \begin{cases} x, x 0 \\ \alpha x, x \le 0 \end{cases}f(x){x,αx,x0x≤0α\alphaα通常是一个很小的常数如 0.01。作用在负区间引入一个微小的斜率使得负区间也有梯度彻底解决死亡 ReLU 问题。PReLU (Parametric ReLU)把 Leaky ReLU 里的α\alphaα当作一个可学习的参数让网络自己训练出最佳的负区间斜率。RReLU (Randomized ReLU)在训练时随机采样负斜率如α∼U(0.01,0.3)增加模型鲁棒性。ELU (Exponential Linear Unit)负区间使用指数函数平滑过渡到−1-1−1输出均值更接近 0缓解了非零中心化问题但计算包含了指数稍慢。GELU / Swish更现代的平滑激活函数目前在 Transformer如 GPT、BERT中极为常见性能优于传统 ReLU。5. 常见应用场景CNN卷积神经网络的隐藏层几乎所有现代 CNN如 ResNet, VGG, YOLO的卷积层后都默认使用 ReLU。MLP多层感知机的隐藏层深度全连接网络的标配。注通常不会在输出层使用 ReLU因为输出层通常有特定的任务需求如分类用 Softmax回归用线性或 tanh。扩展问题既然ReLU 在 0 处不可导为什么还能使用尽管ReLU在 ( x 0 ) 处不可导但在实际训练中不影响使用因为实际训练中某个神经元的输入为 0 的概率极低即使偶尔碰到也可以通过工程上的约定来处理【即在实现反向传播时我们通常会约定 ReLU 在 x0 处的导数为 0 或 1这种约定对结果无影响】。

基于Blazor实现的电梯运行监测系统

为了解决这些痛点，我们基于 .NET 10 AntDesignBlazor Known 技术栈，打造了一套电梯运行监测系统，实现了电梯状态的实时采集、可视化监控、智能告警与日志追溯，帮助物业和维保单位实现电梯的数字化、智能化管理。二、系统架构本系…

2026/6/28 3:17:25 阅读更多

快速上手OpenClaw：数据抓取全攻略

OpenClaw 入门指南OpenClaw 是一款轻量级的开源自动化工具，主要用于数据抓取和任务调度。以下内容将介绍其核心功能、安装方法及代码示例。安装 OpenClaw通过 pip 安装最新版本：pip install openclaw验证安装是否成功：import openclaw print(…

2026/6/28 3:17:05 阅读更多

少数把时间能力写出花的小说

起点的一部新书，算是淘到金了，主角时间能力，《红天觉醒光阴力，神之战场显锋芒》故事编排非常厉害，真的惊艳到我了，少有的能把时间系写出花来的，时间坐标，什么虚空行军，和…

2026/6/28 3:16:04 阅读更多

【JAVA毕设源码分享】基于SpringBoot的旅游景点推荐系统的设计与实现(程序+文档+代码讲解+一条龙定制)

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…

2026/6/28 4:49:05 阅读更多

当“思考”本身被外包出去，思考的主体还是人类吗？

引言：其实”科学实验ai化”潜藏着巨大风险：把人类的思维和创新能力逐步、坚定地让渡给Ai。看似是Ai在人类的指挥和设计下，通过海量的实验，穷举所有的可能，并把穷举的结果如实、完整地端给人类决策。但一方面&#xff0…

2026/6/28 4:49:05 阅读更多

【Springboot毕设全套源码+文档】基于SpringBoot的旅游景点推荐系统的设计与实现(丰富项目+远程调试+讲解+定制)

2026/6/28 4:48:25 阅读更多

热补丁与ftrace的兼容性浅析

一、从ftrace的架构说起 ftrace框架的核心是一个"钩子链"机制。内核编译时开启-pg或-mfentry后，每个函数入口会被插入call __fentry__。内核启动时这些调用被动态替换成NOP；当某个trace功能启用时，再替换为call ftrace_caller。关…

2026/6/28 4:48:05 阅读更多

网络安全基石：一文读懂被动信息收集的原理、方法与防护

在网络安全渗透测试、攻防演练、风险研判的全流程中，信息收集是所有操作的前置核心环节，直接决定后续攻防动作的精准度与成功率。很多人熟知端口扫描、漏洞探测等主动攻击手段，却忽略了被动信息收集这一“无痕迹侦察”技术。作为开源情报&…

2026/6/28 4:46:44 阅读更多

scinique® 双护协同光学技术架构解析——悟赫德护景贴观复盾的系统设计逻辑

屏幕保护膜行业长期存在一个结构性的技术矛盾：要高清通透，就难以做到柔和护眼；要抗眩光，往往以牺牲画面锐度为代价；要物理防护，又担心膜层过厚影响触控灵敏度。这些矛盾之所以难以化解，根源在于…

2026/6/28 4:46:44 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:00:03 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/6/28 1:01:08 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:02:09 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

2026/6/28 0:00:03 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:01:08 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:02:09 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/27 12:47:04 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/27 13:25:14 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/27 13:25:16 阅读更多

相关文章

基于Blazor实现的电梯运行监测系统

快速上手OpenClaw：数据抓取全攻略

少数把时间能力写出花的小说

【JAVA毕设源码分享】基于SpringBoot的旅游景点推荐系统的设计与实现(程序+文档+代码讲解+一条龙定制)

当“思考”本身被外包出去，思考的主体还是人类吗？

【Springboot毕设全套源码+文档】基于SpringBoot的旅游景点推荐系统的设计与实现(丰富项目+远程调试+讲解+定制)

热补丁与ftrace的兼容性浅析

网络安全基石：一文读懂被动信息收集的原理、方法与防护

scinique® 双护协同光学技术架构解析——悟赫德护景贴观复盾的系统设计逻辑

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因