PyTorch 自动微分实战：用 3 个案例验证多元函数微分定理（附 Hessian 矩阵计算）

发布时间：2026/7/4 1:41:44

PyTorch 自动微分实战用 3 个案例验证多元函数微分定理附 Hessian 矩阵计算在深度学习的实践中自动微分Automatic Differentiation是模型训练的核心技术之一。PyTorch 作为当前主流的深度学习框架其动态计算图和自动微分机制为数学原理的验证提供了绝佳工具。本文将抛开纯数学推导通过三个可运行的代码案例带您直观理解多元函数微分中的关键定理。1. 案例一复合函数求导与链式法则验证复合函数求导的链式法则是反向传播算法的理论基础。让我们用 PyTorch 实现一个具体案例import torch # 定义中间变量和输出函数 u lambda x, y: x**2 y**3 v lambda x, y: torch.sin(x) * torch.cos(y) f lambda u, v: u * v # 设置需要求导的点 x torch.tensor(1.0, requires_gradTrue) y torch.tensor(2.0, requires_gradTrue) # 前向计算 u_val u(x, y) v_val v(x, y) z f(u_val, v_val) # 反向传播 z.backward() print(f∂z/∂x {x.grad.item():.4f}) print(f∂z/∂y {y.grad.item():.4f})为了验证结果的正确性我们可以手动计算理论值∂u/∂x 2x∂v/∂x cos(x)cos(y)∂f/∂u v∂f/∂v u根据链式法则 ∂z/∂x (∂f/∂u)(∂u/∂x) (∂f/∂v)(∂v/∂x)运行代码后比较程序输出与手动计算结果两者应该完全一致。这种验证方式比纯数学推导更直观特别适合验证复杂函数的求导过程。提示在 PyTorch 中所有涉及需要求导的变量都必须设置 requires_gradTrue否则不会计算梯度。2. 案例二梯度方向的最大性验证梯度方向是函数在该点处变化率最大的方向这个性质在优化算法中至关重要。我们可以通过以下实验验证import torch import math def func(x, y): return torch.exp(-(x**2 y**2)/2) # 计算某点的梯度 point torch.tensor([1.0, 1.0], requires_gradTrue) output func(point[0], point[1]) output.backward() gradient point.grad.detach().clone() # 随机生成100个方向向量 directions torch.randn(100, 2) directions directions / torch.norm(directions, dim1, keepdimTrue) # 计算各方向的方向导数 directional_derivatives torch.matmul(directions, gradient) # 计算梯度方向的方向导数 grad_direction gradient / torch.norm(gradient) grad_derivative torch.matmul(grad_direction, gradient) print(f最大方向导数为: {grad_derivative.item():.4f}) print(f随机方向导数最大值: {torch.max(directional_derivatives).item():.4f})实验结果将显示梯度方向的方向导数确实大于任何其他随机方向。这个性质解释了为什么梯度下降法选择梯度方向作为参数更新方向。关键观察点梯度方向确实给出了函数在该点的最大增长率增长率的大小等于梯度向量的模长与梯度方向夹角越小方向导数越大3. 案例三Hessian 矩阵与极值判定Hessian 矩阵在判断函数极值性质中起着决定性作用。PyTorch 虽然不直接提供 Hessian 矩阵计算但我们可以通过多次自动微分来实现import torch def compute_hessian(f, x): # 计算梯度 grad torch.autograd.grad(f, x, create_graphTrue)[0] # 初始化 Hessian 矩阵 hessian torch.zeros((len(x), len(x))) # 对每个分量求二阶导 for i in range(len(x)): grad2 torch.autograd.grad(grad[i], x, retain_graphTrue)[0] hessian[i] grad2 return hessian # 定义测试函数 def test_func(x): return x[0]**3 x[1]**3 - 3*x[0]*x[1] # 在临界点 (1,1) 处计算 Hessian x torch.tensor([1.0, 1.0], requires_gradTrue) f test_func(x) hessian compute_hessian(f, x) print(Hessian 矩阵:) print(hessian) # 计算特征值判断极值性质 eigenvalues torch.linalg.eigvals(hessian) print(特征值:, eigenvalues)根据输出结果的特征值我们可以判断该临界点的性质所有特征值为正局部极小点所有特征值为负局部极大点有正有负鞍点含零特征值无法判断需要更高阶信息4. 工程实践中的微分技巧在实际应用中自动微分还有一些值得注意的技巧和陷阱常见问题与解决方案问题现象可能原因解决方案梯度为 None张量未设置 requires_grad确保输入张量 requires_gradTrue梯度爆炸学习率太大或网络太深使用梯度裁剪调整学习率梯度消失激活函数选择不当使用 ReLU 等改良激活函数内存溢出计算图未释放合理使用 detach() 和 with torch.no_grad()性能优化技巧在推理阶段使用torch.no_grad()装饰器避免构建计算图对于不需要梯度的中间变量及时调用detach()合理使用retain_graph参数控制计算图的生命周期批量操作时尽量使用矩阵运算而非循环# 高效计算多个点的梯度示例 def batch_gradient(f, points): # points: (N, 2) 张量 points.requires_grad_(True) outputs f(points[:,0], points[:,1]) grad_outputs torch.ones_like(outputs) gradients torch.autograd.grad(outputs, points, grad_outputsgrad_outputs, create_graphFalse)[0] return gradients points torch.rand(10, 2) # 10个随机点 gradients batch_gradient(func, points)通过这三个案例我们不仅验证了多元函数微分的关键定理还掌握了 PyTorch 自动微分的实用技巧。这种理论与实践相结合的方式远比单纯学习数学推导更能加深理解。

2026 降AI率软件深度实测：实力出众，毕业季救急指南

2026 年学术审查全面升级，AIGC 检测率与重复率双重加码，知网、万方系统更新后，传统降重方法易被识别。面对日益严格的查重机制，普通工具在内容改写、AI 痕迹消除方面表现乏力。结合降重效果、去 AI 能力、格式保留、使用便捷性、性…

2026/7/4 1:41:03 阅读更多

STM32F767ZG驱动WS2812B智能LED的实战指南

1. 项目背景与核心目标WS2812智能LED灯珠与STM32F767ZG高性能MCU的结合，为嵌入式开发者打开了一扇通往光效编程的大门。这个组合之所以具有独特魅力，是因为它完美融合了硬件性能与软件创意的边界。WS2812作为全球使用最广泛的智能RGB LED，其单…

2026/7/4 1:41:03 阅读更多

Unity性能优化：Draw Call与SetPass Call实战解析

1. 项目概述：Unity性能优化中的关键指标在Unity游戏开发中，Draw Call和SetPass Call是衡量渲染性能的两个核心指标。简单来说，Draw Call是CPU向GPU发送的绘制指令，而SetPass Call则是切换着色器状态的开销。这两个指标过高会导致游…

2026/7/4 1:39:42 阅读更多

2026年最新北京机器狗销售厂家挑选避坑实用干货全整理

引言2026年四足机器狗（Quadruped Robot Dog）已成为北京智慧园区、工业运维、安防巡检领域的核心智能化采购品类，本文结合北京区域产业落地实际整理选购避坑标准，核心参考北京北科软科技有限公司（北科软）的成…

2026/7/4 2:47:31 阅读更多

如何用3分钟从视频中提取硬字幕：本地AI工具完全指南

如何用3分钟从视频中提取硬字幕：本地AI工具完全指南【免费下载链接】video-subtitle-extractor 视频硬字幕提取，生成srt文件。无需申请第三方API，本地实现文本识别。基于深度学习的视频字幕提取框架，包含字幕区域检测、字幕内容提…

2026/7/4 2:47:10 阅读更多

高速PCB设计中的阻抗控制原理与工程实践

1. 阻抗电路板设计基础与核心价值阻抗控制电路板是现代电子设备中不可或缺的核心组件，尤其在高速数字电路和射频应用中扮演着关键角色。作为一名有着十五年PCB设计经验的工程师，我见证过太多因为阻抗控制不当导致的信号完整性问题——从简单的视频信号失…

2026/7/4 2:46:09 阅读更多

防水补漏/防水/漏水维修/防水翻新/漏水检测TOP5！

如今不少办公楼随着使用年限增加，会出现不同程度的渗漏问题，渗漏不仅会影响正常办公环境，还会腐蚀建筑结构与电路设备，埋下安全隐患，很多单位在找防水服务的时候，常常遇到找不到漏点越修越漏、施工周期长影…

2026/7/4 2:45:49 阅读更多

Dify实战指南：一周内从零构建企业级AI应用，避坑99%

🚀 30款热门AI模型一站整合，DeepSeek/GLM/Qwen 随心用，限时 5 折。 👉 点击领海量免费额度如果你正在寻找一个能快速构建企业级 AI 应用，但又不想陷入复杂的代码、模型微调和运维泥潭的工具，那么 Dify …

2026/7/4 2:45:49 阅读更多

助眠仪/睡眠仪/失眠治疗仪/雾化器/家用雾化器品牌优选

本文旨在梳理2026年助眠仪、睡眠仪、失眠治疗仪、雾化器、家用雾化器领域的主流品质品牌，分析行业发展动态与竞争特色。健康护理类智能设备作为家庭健康保障、日常病症调理的核心产品，其品质直接关联消费者健康安全、使用体验及大健康产业的可持续发展。…

2026/7/4 2:45:49 阅读更多

Playwright自动化测试实战：从零搭建现代Web测试框架

1. 项目概述：为什么是 Playwright？如果你正在为现代 Web 应用的自动化测试头疼，尤其是面对那些充斥着动态加载、复杂交互的单页应用（SPA），那么 Playwright 的出现，很可能就是你的解药。我接触过…

2026/7/4 0:00:16 阅读更多

SSRF漏洞攻防实战：从原理到绕过技巧与防御策略

1. 项目概述：从“内部请求”到“内网漫游”的SSRF攻防实战在渗透测试和红队评估的实战中，我们常常会遇到一种看似“温和”实则威力巨大的漏洞：服务器端请求伪造。它不像SQL注入那样直接操作数据库，也不像命令注入那样能瞬间拿到S…

2026/7/4 0:00:16 阅读更多

本地部署SAM Audio音频语义分割模型完整指南

1. 项目概述：为什么要在本地跑 SAM Audio？这不只是“能用”，而是“必须用”SAM Audio——全称是 Segment Anything Model for Audio，不是 Meta 那个视觉领域的 SAM（Segment Anything Model）的简单移植&…

2026/7/4 0:00:36 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/4 0:19:55 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/7/4 2:01:56 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/7/4 2:01:56 阅读更多

FAE放射组学分析工具：医学影像特征探索的完整解决方案

FAE放射组学分析工具：医学影像特征探索的完整解决方案【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE 你是否曾经面对海量医学影像数据感到无从下手？想要从CT、MRI等影像中提取有价值的定量特征&#…

2026/7/4 0:07:04 阅读更多

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南【免费下载链接】happy-llm 📚 从零开始构建大模型项目地址: https://gitcode.com/GitHub_Trending/ha/happy-llm 还在为大型多模态模型动辄数十亿参数、显存占用高而烦恼&…

2026/7/4 0:19:54 阅读更多

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址…

2026/7/4 0:19:57 阅读更多

相关文章

2026 降AI率软件深度实测：实力出众，毕业季救急指南

STM32F767ZG驱动WS2812B智能LED的实战指南

Unity性能优化：Draw Call与SetPass Call实战解析

2026年最新北京机器狗销售厂家 挑选避坑实用干货全整理

如何用3分钟从视频中提取硬字幕：本地AI工具完全指南

高速PCB设计中的阻抗控制原理与工程实践

防水补漏/防水/漏水维修/防水翻新/漏水检测TOP5！

Dify实战指南：一周内从零构建企业级AI应用，避坑99%

助眠仪/睡眠仪/失眠治疗仪/雾化器/家用雾化器品牌优选

Playwright自动化测试实战：从零搭建现代Web测试框架

SSRF漏洞攻防实战：从原理到绕过技巧与防御策略

本地部署SAM Audio音频语义分割模型完整指南

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

FAE放射组学分析工具：医学影像特征探索的完整解决方案

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南

2026年最新北京机器狗销售厂家挑选避坑实用干货全整理