深度学习------激活函数

发布时间：2026/6/10 15:33:25

先说说激活函数你可以把神经网络想象成一个工厂流水线数据就是原材料一层层传递加工。但如果没有激活函数这个流水线就很无聊——每一层都只是做简单的加减乘除整条线不管多少层最后顶多算个复杂的线性方程解决不来复杂问题。以两层网络推导为例激活函数就像流水线上的「魔法师」它在每一层数据处理后给数据来个「变身」引入一些非线性的变化。这样神经网络才能学习复杂规律比如识别猫狗、判断情感之类的。常用激活函数白话解释1.Sigmoid函数 —— 「压缩大师」样子把任何数字都压缩到0和1之间大白话想象一个「概率制造机」。不管输入多大或多小比如1000或-1000它都会输出一个0到1之间的概率值。输入越大输出越接近1输入越小输出越接近0。生活类比就像评委打分不管选手多强或多差最后得分总是在0分到1分之间。缺点当数字很大或很小时它会变得特别「佛系」几乎不变了梯度消失训练起来就很慢。2.Tanh函数 —— 「零为中心压缩大师」样子把任何数字压缩到-1和1之间中心点是0大白话Sigmoid的升级版输出范围变成了-1到1平均值是0。这让它处理数据更「平衡」一些。生活类比像情绪评分-1代表极度负面0代表中性1代表极度正面。优点比Sigmoid对称性好训练起来稍微舒服点。缺点跟Sigmoid一样在极端值时也会「佛系」梯度消失。3.ReLU函数 —— 「要么通过要么滚蛋」样子正数原样通过负数直接变0公式f(x) max(0, x)大白话最暴力的激活函数。规则简单到爆输入是正数原封不动通过输入是负数直接清零滚蛋生活类比像公司门口的保安只放行有正事的人正数闲杂人等负数一律拦下。优点计算超快训练速度飞快是现在深度学习最受欢迎的激活函数。缺点有时候会把所有神经元都「卡住」全部输出0Dead ReLU问题整条线就瘫痪了。4.Softmax函数 —— 「概率分配大师」样子把一堆数字变成概率分布总和为1大白话多分类问题的专属神器。想象你有5个选择每个选择有个分数Softmax把这些分数转换成概率所有概率加起来正好等于100%。哪个分数高对应的概率就大。生活类比就像期末考试排名把所有学生的分数转换成「获得第一名的概率」。学霸概率高学渣概率低所有人概率加起来是100%。用途专门用在输出层用来做多分类判断比如判断这张图是猫、狗还是鸟。Sigmoid 函数以前很常用现在不怎么用了因为它有两个大缺点训练慢、容易“学不动”。问题1什么叫“梯度消失”想象一下你在教一个学生学习每一步都要根据错误来调整学习方法。在神经网络中这个“调整”靠的是“梯度”——就是告诉模型“你这步错了多少该往哪个方向改”。但 Sigmoid 函数有个问题它的“导数”也就是用来算梯度的值很小通常在 0 到 0.25 之间。当神经网络有很多层时要从最后一层一层一层往回算梯度叫“链式求导”这就相当于把很多个小数连着乘起来。比如0.2 × 0.2 × 0.2 × ……几十次→ 结果会变得特别特别小几乎等于 0。这就叫“梯度消失”—— 意思是前面几层的参数根本得不到有效更新就像学生前几节课完全没学到东西只能原地踏步。类比你让一个人从第100层楼往下传一句话每传一层就小声一点到第1层的时候别人根本听不见。这就是“梯度消失”。问题2计算太复杂训练慢Sigmoid 函数里面有个指数运算比如 e 的幂计算机算起来比较费时间。就像你每次做题都要先算个复杂的公式自然就慢了。所以用 Sigmoid 的网络训练起来特别耗时效率低。

使用百度智能云AI语音合成API和pcm-player组件，开发移动端H5文章AI语音实时朗读功能

项目需求： 开发手机H5前端，页面有一篇文章，点击朗读按钮，开始播放AI语音朗读文章内容。客户已选择使用百度智能云产品。关键技术栈： Vue3 websocket pcm-player 在百度智能云文档中心-语音合成栏目中，百…

2026/6/10 15:31:41 阅读更多

如何用99个公共Tracker服务器打造极速BT下载网络：Trackerslist完整指南

如何用99个公共Tracker服务器打造极速BT下载网络：Trackerslist完整指南【免费下载链接】trackerslist Updated list of public BitTorrent trackers 项目地址: https://gitcode.com/GitHub_Trending/tr/trackerslist 你是否曾因BT下载速度缓慢而沮丧&#x…

2026/6/10 15:28:37 阅读更多

03、JAVAEE---多线程(三)

队列可以有两种实现方式：size变量 vs 预留空间一、什么是阻塞队列？1、手动实现相较于传统队列，阻塞队列线程安全，因为其带有阻塞效果package javaee;import java.util.concurrent.ArrayBlockingQueue;public class MyBlockingQueu…

2026/6/10 15:26:15 阅读更多

告别年月日！在uni-app里用picker实现‘仅选择月份’的3种实战方案

在uni-app中优雅实现月份选择的3种技术方案深度解析移动端表单设计中，日期选择是高频需求场景，但传统日期选择器往往让用户在多层级菜单中反复操作。当业务仅需精确到月份时（如信用卡有效期、报表周期、会员订阅），完整…

2026/6/10 16:53:01 阅读更多

ARM7TDMI-S双AHB总线架构解析：LPC2470外设集成与嵌入式系统设计

1. 项目概述与核心价值在嵌入式系统开发的江湖里，选型一颗合适的微控制器（MCU）往往是项目成败的第一步。今天，我想和大家深入聊聊一款在工业控制、人机界面和网络设备领域曾经风光无限，至今仍在许多存量项目和特定场景…

2026/6/10 16:52:41 阅读更多

想转行做AGV/AMR工程师？这份保姆级技能清单和避坑指南请收好

从零到一：AGV/AMR工程师转型实战手册第一次看到AGV小车在仓库里自如穿梭时，我被这种"会思考的轮子"彻底迷住了。它们像有生命的棋子，在复杂的工厂棋盘上执行着精确的移动——这正是我决定转型的起点。如果你也正站在职业转型的十字…

2026/6/10 16:52:41 阅读更多

生产级机器学习服务的七道防线：从Notebook到高可用部署

1. 项目概述：当模型走出Jupyter，真正开始呼吸真实世界的空气 “From Notebook to Production: Running ML in the Real World (Part 4)”——这个标题本身就像一句暗号，专为那些在Jupyter里调通了模型、画出了漂亮ROC曲线、却在部署时被现实迎…

2026/6/10 16:51:19 阅读更多

避开这些坑！中兴交换机堆叠配置中关于检测口（MMD Port）和端口组的常见误区解析

中兴交换机堆叠配置实战：检测口与端口组的深度避坑指南堆叠技术作为现代网络架构中的核心能力，能将多台物理交换机虚拟化为单一逻辑设备。但在实际部署中，不少工程师对**堆叠检测口（MMD Port）和堆叠业务端口组&#xf…

2026/6/10 16:50:18 阅读更多

给软件工程师的计算机组成原理：透过CU微命令理解程序是如何真正‘跑’起来的

给软件工程师的计算机组成原理：透过CU微命令理解程序是如何真正‘跑’起来的当你写下a b c这样简单的C语言语句时，可曾想过这行代码究竟是如何在硬件层面被执行的？现代软件开发越来越依赖高级语言的抽象，但真正理解计算机如何工…

2026/6/10 16:48:56 阅读更多

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析【免费下载链接】NomNom NomNom is the most complete savegame editor for NMS but also shows additional information around the data youre about to change. You can also easily look up each …

2026/6/10 0:00:34 阅读更多

从导航软件到游戏寻路：用C++手把手实现Dijkstra最短路径算法（附完整代码）

从导航软件到游戏寻路：用C手把手实现Dijkstra最短路径算法每次打开手机地图导航，或是操控游戏角色穿越复杂地形时，背后都藏着一个数学魔法——最短路径算法。Dijkstra算法作为图论中的经典解决方案，从1956年诞生至今，已…

2026/6/10 0:01:14 阅读更多

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱，支持下载视频、番剧等等各类资源项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/6/10 0:02:17 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/10 0:41:57 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/10 0:41:54 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/10 0:32:14 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/10 9:56:42 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/10 9:56:39 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/10 9:56:34 阅读更多

相关文章