Pytorch深度学习实践笔记 --- 反向传播Back Propagation

发布时间：2026/5/19 23:21:44

前情提要梯度下降算法 Gradient DescentGradient梯度就是对cost(w)求倒数 g ∂cost(w)/∂w 代表当前函数cost(w)的趋势Update w w - a * ga --- 学习率 w - a * ∂cost(w)/∂w 梯度开始下降迭代过程就是根据梯度实现若g0此时cost(w)单调减则w若g0cost(w)单调增则w都是往下降方向走由于本质是贪心所以不一定得到全局最优而是局部最优两者。x_data [1.0, 2.0, 3.0] y_data [2.0, 4.0, 6.0] w 1 def forward(x): return w * x def cost(xs, ys): # 传进来的是x_data和y_data的列表 cost 0 for x, y in zip(xs, ys): # 遍历两个列表 y_pred forward(x) cost (y_pred - y) ** 2 return cost / len(xs) def gradient(xs, ys): grad 0 for x, y in zip(xs, ys): grad 2 * x * (x * w - y) # 对cost求导数化简后得 return grad / len(xs) a 0.01 # 学习率 for epoch in range(1, 10, 1): cost_val cost(x_data, y_data) grad_val gradient(x_data, y_data) w w - a * grad_val print(fEpoch {epoch}, w {w}, loss {cost_val}) print(-------------------------------------------)随机梯度下降Stochastic Gradient Descent --- SGD该算法源于梯度下降算法中的求和导致难以并行运算只求损失loss可以提高效率。∂loss/∂w d(y_pred - y)^2 / dw 2 * x * (x * w - y)w w - a * ∂loss/∂wx_data [1.0, 2.0, 3.0] y_data [2.0, 4.0, 6.0] w 1.0 def forward(x): return x * w def loss(x, y): y_pred forward(x) return (y_pred - y) ** 2 # y_pred与实际y比较来算loss def gradient(x, y): return 2.0 * x * (x * w - y) # 对loss求导数化简后得 for epoch in range(1, 10, 1): for x, y in zip(x_data, y_data): grad_val gradient(x, y) w w - 0.01 * grad_val # update print(fEpoch {epoch}, w {w}, loss {loss(x, y)})反向传播 Back Propagation前提多层神经网络的局部梯度传递目的是为了求loss关于w的导数来算梯度即 ∂loss/∂w数学原理链式求导对于两层神经网络y_pred W2(W1*X b1) b2第一层第二层 W2*W1*X (W2*b1 b2) W*X b注根据以上推导无论几层都能线性表示所以就没有意义了于是引入nonlinear function。计算步骤1、create computational graph(forward)x,w - f - f(x,w) - z - ... - loss2、local gradient 局部梯度 --- 正向目标算出损失loss - z ( ∂L/∂z ) - f( ∂z/∂x , ∂z/∂w ) - x( ∂L/∂x ∂L/∂z * ∂z/∂x ) ,w( ∂L/∂w ... )3、backward --- 反向目标求梯度通过反向传播进行链式求导更新梯度以上步骤的进行目的是求 ∂loss/∂wx_data [1.0, 2.0, 3.0] y_data [2.0, 4.0, 6.0] w1 torch.Tensor([1.0]) # 创建一个张量wTensor中包含data和graddata和grad也是Tensor w1.requires_grad True # 需要计算梯度 w2 torch.Tensor([1.0]) w2.requires_grad True b torch.Tensor([1.0]) b.requires_grad True def forward(x): return w1 * x ** 2 w2 * x b def loss(x, y): # 构建计算图, tensor 做计算就会构建计算图 y_pred forward(x) return (y_pred - y) ** 2 def gradient(x, y): # ∂loss/∂w return 2.0 * x * (x * w - y) print(Predict (before training),4,forward(4)) a 0.01 # 设置学习率 for epoch in range(1, 100, 1): for x, y in zip(x_data, y_data): l loss(x, y) l.backward() # 不断计算梯度 print(\tgrad:, x, y, w1.grad.item(), w2.grad.item(), b.grad.item())#梯度值的标量数值.item() 方法的作用是将只包含一个元素的 PyTorch tensor 转换为普通的 Python 数值类型如 float。这样做是为了打印时更清晰显示的是具体的数字而不是 tensor 对象。 # 注意这里的grad是一个tensor所以要取他的data w1.data w1.data - a * w1.grad.data w2.data w2.data - a * w2.grad.data b.data b.data - a * b.grad.data # 释放之前计算的梯度 w1.grad.data.zero_() w2.grad.data.zero_() b.grad.data.zero_() print(Epoch:, epoch, l.item()) print(predict (after training), 4, forward(4).item())

Rust错误处理：Result与Error深度解析

Rust错误处理：Result与Error深度解析引言在Rust开发中，错误处理是其最独特的特性之一。作为一名从Python转向Rust的后端开发者，我深刻体会到Rust在错误处理方面的严谨性。Rust通过Result类型和panic机制，在编译时强制处理错误&a…

2026/5/19 23:21:02 阅读更多

C#正课十七

1、容器Panel Panel创建一个容器，在容器内的控件大小无法超出Panel的大小，将控件在容器中可以通过Dock和Anchor来控制布局。 FiowLayoutPanel创建的容器遵循流布局，其中的控件会默认向上向左停靠 TableLayoutPanel列表布局。容器会默认分为4…

2026/5/19 23:21:02 阅读更多

终极QR二维码修复工具：QRazyBox完整指南与高效恢复技巧

终极QR二维码修复工具：QRazyBox完整指南与高效恢复技巧【免费下载链接】qrazybox QR Code Analysis and Recovery Toolkit 项目地址: https://gitcode.com/gh_mirrors/qr/qrazybox 还在为损坏的二维码无法扫描而烦恼吗？QRazyBox是一款专业的免费…

2026/5/19 23:20:42 阅读更多

联想/兄弟打印机在银河麒麟系统下的‘替身’安装法：以M7450F Pro为例

联想/兄弟打印机在银河麒麟系统下的‘替身’安装法：以M7450F Pro为例在国产操作系统逐步普及的今天，银河麒麟系统以其安全稳定的特性赢得了不少政企用户的青睐。然而，硬件兼容性始终是用户迁移过程中最常遇到的"拦路虎"之一。特别…

2026/5/20 0:22:11 阅读更多

DDR2 / DDR3 / DDR4 颗粒信号差异对照表

DDR2 与 DDR3 颗粒引脚信号一一对应对照表信号组别DDR2 信号名DDR3 对应信号名功能一致差异说明差分时钟CK、CK#CK、CK#✅ 完全一致功能、时序定义相同，仅电平不同时钟使能CKECKE✅ 完全一致高低电平逻辑、工作模式控制相同硬件复位无RESET#❌ DDR2 无DDR3 新增&…

2026/5/20 0:21:10 阅读更多

DDR3 颗粒信号定义解析

本文围绕 DDR3 标准信号定义、核心信号工作原理、PCB Layout 等长设计规则及行业常见误区展开，全程聚焦工程实践与底层原理。一、DDR3 标准信号完整清单（x16 位宽基准，x32 位宽对应翻倍）1. 数据信号（Data）表…

2026/5/20 0:21:10 阅读更多

从‘官方小人’到‘我的角色’：深入拆解Unity Third Person模板的动画与输入系统接管逻辑

从‘官方小人’到‘我的角色’：深入拆解Unity Third Person模板的动画与输入系统接管逻辑在Unity中，官方提供的Third Person模板为开发者快速搭建角色控制系统提供了便利。但当你需要替换一个骨骼结构与标准Humanoid差异较大的自定义模型时，…

2026/5/20 0:19:28 阅读更多

Ant Design Vue Table 合计行不显示？别再用 push 了，试试这个 pageSize+1 的巧妙解法

Ant Design Vue Table 合计行显示难题：pageSize1 的优雅解决方案问题背景与现象分析在使用 Ant Design Vue 的 Table 组件时，很多开发者都遇到过这样一个棘手问题：当我们需要在表格底部添加合计行时，通过常规的数组 push 方法将…

2026/5/20 0:19:28 阅读更多

红外图像/红外遥感图像/可见光红外图像对近红外和可见光成对图像生成对抗网络的风格迁移，或者图像融合/图像生成/图像转换可见光遥感生成红外遥感图像，37500对图像数据

红外图像/红外遥感图像/可见光红外图像对近红外和可见光成对图像生成对抗网络的风格迁移，或者图像融合/图像生成/图像转换可见光遥感生成红外遥感图像，37500对图像数据文章目录**数据集描述：**🧾 项目背景🧰 一、环…

2026/5/20 0:18:06 阅读更多

顶伯在线语音工具背后的技术力量：AI语音合成与深度学习解析

顶伯在线语音工具背后的技术力量在人工智能浪潮中，语音交互正成为人机沟通的核心方式。顶伯作为行业领先的在线语音工具，凭借自主研发的深度学习架构，将文字转化为高度自然的语音，广泛应用于有声阅读、智能客服、教育辅助等领域。…

2026/5/20 0:00:25 阅读更多

全志V3s开发板实战：用Buildroot 2020.02.4定制你的第一个最小Linux文件系统

全志V3s开发板实战：用Buildroot 2020.02.4定制最小Linux文件系统在嵌入式开发领域，构建一个精简高效的Linux文件系统往往是项目成功的关键第一步。全志V3s作为一款高性价比的ARM Cortex-A7芯片，搭配Buildroot这一经典构建工具，能…

2026/5/20 0:00:25 阅读更多

百考通：AI赋能期刊论文写作，智能生成优质内容

在学术研究领域，期刊论文的撰写是成果输出的关键环节，却也让众多科研工作者与学生倍感压力：选题迷茫、逻辑梳理困难、格式规范复杂、内容提炼耗时，严重拖慢了学术成果的发表节奏。百考通（https://www.baikaotongai.com…

2026/5/20 0:00:46 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/19 4:14:12 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/19 6:17:20 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/19 0:56:48 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/19 0:13:34 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/19 0:00:02 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/19 22:33:20 阅读更多

相关文章