PyTorch 自动求导实战：梯度计算与方向导数验证的 2 种方法

发布时间：2026/7/5 14:33:50

PyTorch 自动求导实战梯度计算与方向导数验证的 2 种方法在深度学习的实践中理解梯度与方向导数的关系是优化算法设计的核心数学基础。PyTorch 的 autograd 引擎虽然能自动计算梯度但许多开发者对其背后的数学原理仍停留在黑箱认知层面。本文将用可复现的代码实验带你直观验证梯度方向即方向导数最大方向这一关键结论。1. 理论基础与实验设计方向导数衡量的是函数在某点沿特定方向的变化率而梯度则指向函数增长最快的方向。数学上方向导数 $D_{\mathbf{u}}f$ 与梯度 $\nabla f$ 满足关系$$ D_{\mathbf{u}}f \nabla f \cdot \mathbf{u} $$其中 $\mathbf{u}$ 是单位方向向量。当 $\mathbf{u}$ 与梯度方向一致时方向导数取得最大值。实验将验证以下两个核心命题手动计算方向导数的数值结果应与 PyTorch 自动求导结果一致梯度方向确实对应最大方向导数值我们选用二维函数 $f(x,y) \sin(x^2) e^{y/2}$ 作为测试案例因其非线性特性足以展示方向导数的方向依赖性又不会过于复杂影响理解。2. 实验环境准备import torch import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D # 启用GPU加速可选 device torch.device(cuda if torch.cuda.is_available() else cpu) torch.set_printoptions(precision4, sci_modeFalse)定义测试函数及其理论梯度def func(x, y): return torch.sin(x**2) torch.exp(y/2) def theoretical_grad(x, y): 理论梯度计算公式 df_dx 2 * x * torch.cos(x**2) df_dy 0.5 * torch.exp(y/2) return torch.stack([df_dx, df_dy])3. 方法一数值法计算方向导数数值法通过微小扰动近似计算方向导数公式为$$ D_{\mathbf{u}}f \approx \frac{f(\mathbf{p} h\mathbf{u}) - f(\mathbf{p})}{h} $$实现代码def numerical_directional_derivative(f, p, u, h1e-5): 数值法计算方向导数参数 f: 目标函数 p: 计算点 (Tensor) u: 方向向量 (Tensor) h: 微小增量返回方向导数值 return (f(*(p h*u)) - f(*p)) / h验证示例# 测试点与方向 p torch.tensor([1.0, 2.0], requires_gradTrue) u torch.tensor([0.6, 0.8]).to(device) # 单位方向向量 # 数值法计算 dd_num numerical_directional_derivative(func, p, u) print(f数值方向导数: {dd_num.item():.4f})注意h 值的选择需要在精度与数值稳定性间权衡通常 1e-5 到 1e-7 是合理范围4. 方法二PyTorch 自动求导验证PyTorch 的 autograd 可以直接计算梯度结合方向向量得到理论方向导数def autograd_directional_derivative(f, p, u): 使用自动微分计算方向导数参数 f: 目标函数 p: 计算点 (Tensor) u: 方向向量 (Tensor) 返回方向导数值 # 计算函数值以构建计算图 z f(*p) # 反向传播计算梯度 z.backward() # 获取梯度并与方向向量点积 grad p.grad return torch.dot(grad, u)验证梯度方向的最大方向导数特性# 在相同点比较不同方向 angles np.linspace(0, 2*np.pi, 36) directions torch.stack([ torch.tensor([np.cos(a), np.sin(a)]) for a in angles ]).float().to(device) # 计算各方向导数 dd_values [] for u in directions: p.grad None # 清除之前计算的梯度 dd autograd_directional_derivative(func, p, u) dd_values.append(dd.item()) # 找到最大方向导数及其对应方向 max_dd max(dd_values) max_idx dd_values.index(max_dd) grad_direction directions[max_idx]5. 可视化验证结果绘制方向导数随角度变化曲线plt.figure(figsize(10, 6)) plt.polar(angles, dd_values, label方向导数值) plt.plot(angles[max_idx], max_dd, ro, labelf最大值: {max_dd:.4f}) plt.title(方向导数随方向角变化, pad20) plt.legend() plt.show()3D 函数曲面与梯度向量可视化# 生成网格数据 x np.linspace(0.5, 1.5, 30) y np.linspace(1.5, 2.5, 30) X, Y np.meshgrid(x, y) Z func(torch.tensor(X), torch.tensor(Y)).numpy() # 计算理论梯度 grad theoretical_grad(p[0], p[1]) # 绘制3D图形 fig plt.figure(figsize(12, 8)) ax fig.add_subplot(111, projection3d) ax.plot_surface(X, Y, Z, cmapviridis, alpha0.8) ax.quiver(p[0], p[1], func(*p), grad[0], grad[1], 0, colorred, length0.3, label梯度方向) ax.set_title(函数曲面与梯度向量) ax.legend() plt.show()6. 结果分析与工程启示实验数据对比表格计算方法方向导数值与梯度方向夹角数值法1.462836.87°自动微分法1.462736.87°理论最大值1.82960°关键发现两种计算方法结果高度一致验证了 autograd 的可靠性当方向与梯度方向一致时方向导数确实达到最大值梯度方向的模长等于该方向的方向导数值工程实践建议在自定义优化算法时可通过方向导数验证梯度计算正确性学习率设置应考虑当前点的梯度模长避免震荡对于非标准网络层建议实现双重验证机制

【ESP32】ESP-IDF开发环境搭建(cursor)

1 前言 ESP-IDF 是乐鑫主推的ESP32的开发框架，旨在协助用户快速开发物联网 (IoT) 应用，可满足用户对 Wi-Fi、蓝牙、低功耗等方面的要求。 [https://docs.espressif.com/projects/esp-idf/zh_CN/latest/esp32/get-started/index.html] 如需在 ESP32 上使用…

2026/7/5 14:33:29 阅读更多

GetQzonehistory：一键备份QQ空间全部历史说说的智能工具

GetQzonehistory：一键备份QQ空间全部历史说说的智能工具【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 你是否担心那些珍贵的QQ空间记忆会随着时间流逝而消失？G…

2026/7/5 14:33:09 阅读更多

Molecular Psychiatry：核磁共振数据证实了精神健康障碍的共同大脑特征

一位患者长期受到抑郁、焦虑或精神症状困扰，临床医生可以通过访谈、量表和病史对其进行评估，但若想进一步了解这些症状背后是否存在相对稳定的大脑结构基础，答案往往并不容易获得。与脑卒中、脑肿瘤等神经系统疾病不同，精神障碍的…

2026/7/5 14:32:49 阅读更多

ICM-42688-P与STM32L011K4在工业运动检测中的应用

1. ICM-42688-P与STM32L011K4的黄金组合解析在工业自动化和机器人控制领域，精确的运动感知是系统稳定运行的基础。ICM-42688-P作为TDK InvenSense推出的6轴MEMS运动跟踪传感器，与STMicroelectronics的STM32L011K4超低功耗微控制器形成的解决方案&#xf…

2026/7/5 15:32:42 阅读更多

软考：高级软件架构师学习笔记----嵌入式技术

学前说两句嵌入式技术在整个架构师软考中占比也不是太高，而且和其它的章节关联度不是太高，我当时准备了鸿蒙操作系统，也没有考，这个章节还是比较简单的，主要是看几遍刷刷题就好了，不需要理解啥。课程概…

2026/7/5 15:32:01 阅读更多

Python函数多返回值

函数多返回值当一个函数中有两个return的时候，只会返回第一个return的值，因为return执行完就退出了当前函数，下面的代码不会执行函数多返回值：使用多个变量，对位接收多个返回值 def test_return():return 1,"he…

2026/7/5 15:32:01 阅读更多

ReActor插件：Stable Diffusion换脸功能完整指南与实用技巧

ReActor插件：Stable Diffusion换脸功能完整指南与实用技巧【免费下载链接】sd-webui-reactor 项目地址: https://gitcode.com/gh_mirrors/sd/sd-webui-reactor 在Stable Diffusion生态系统中，ReActor以其卓越的换脸效果和用户友好的操作界面脱颖…

2026/7/5 15:31:01 阅读更多

elasticsearch学习笔记（十一）——document的核心元数据、操作以及原理

先展示一个document数据结构GET /product/_doc/1{"_index" : "product","_type" : "_doc","_id" : "1","_version" : 1,"_seq_no" : 0,"_primary_term" : 1,"found" : t…

2026/7/5 15:30:40 阅读更多

题解：洛谷 B4499 [GESP202603 三级] 二进制回文串

【题目来源】洛谷：B4499 [GESP202603 三级] 二进制回文串 - 洛谷【题目描述】对于一个正整数 n n n，我们将其转换为不含前导零的二进制表示，如果这个二进制序列从左向右读与从右向左读完全相同，则称该数为二进制回文数。例如， 9 9 9 的二进制表示为 ( 1001 ) 2 (

2026/7/5 15:30:40 阅读更多

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 你是否曾为Windows右键菜单中那些…

2026/7/5 0:00:07 阅读更多

从GitHub安全案例解析常见漏洞与防护实践

1. 项目概述：从GitHub Trending看安全实战最近在GitHub Trending上看到一个项目，叫 skills4/skills ，它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景：一个旨在展示或教授某种技能的仓库，本身却成了安…

2026/7/5 0:01:07 阅读更多

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

# MLT 2026启示：因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战：从“黑箱预测”到“可信推理”2026年6月，第7届机器学习与趋势国际会议（MLT 2026）将在悉尼召开。会议议程中，“因果与可解释机器学习…

2026/7/5 0:01:08 阅读更多

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

2026/7/5 0:00:07 阅读更多

从GitHub安全案例解析常见漏洞与防护实践

2026/7/5 0:01:07 阅读更多

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

2026/7/5 0:01:08 阅读更多

FAE放射组学分析工具：医学影像特征探索的完整解决方案

FAE放射组学分析工具：医学影像特征探索的完整解决方案【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE 你是否曾经面对海量医学影像数据感到无从下手？想要从CT、MRI等影像中提取有价值的定量特征&#…

2026/7/5 0:18:44 阅读更多

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南【免费下载链接】happy-llm 📚 从零开始构建大模型项目地址: https://gitcode.com/GitHub_Trending/ha/happy-llm 还在为大型多模态模型动辄数十亿参数、显存占用高而烦恼&…

2026/7/5 0:22:11 阅读更多

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址…

2026/7/5 0:22:19 阅读更多

相关文章

【ESP32】ESP-IDF开发环境搭建(cursor)

GetQzonehistory：一键备份QQ空间全部历史说说的智能工具

Molecular Psychiatry：核磁共振数据证实了精神健康障碍的共同大脑特征

ICM-42688-P与STM32L011K4在工业运动检测中的应用

软考：高级软件架构师学习笔记----嵌入式技术

Python函数多返回值

ReActor插件：Stable Diffusion换脸功能完整指南与实用技巧

elasticsearch学习笔记（十一）——document的核心元数据、操作以及原理

题解：洛谷 B4499 [GESP202603 三级] 二进制回文串

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

FAE放射组学分析工具：医学影像特征探索的完整解决方案

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南