用Python动手推导：能量守恒、勾股定理与机器学习损失函数之间的奇妙联系

发布时间：2026/6/2 6:26:04

用Python动手推导能量守恒、勾股定理与机器学习损失函数之间的奇妙联系在数学和物理的交汇处隐藏着一些令人着迷的普遍规律。当我们用Python将这些抽象概念可视化时会发现从经典物理学到现代机器学习其实共享着相同的数学基础。本文将带你用NumPy和Matplotlib从零开始编码实现这些概念的直观理解最终将它们与机器学习中的损失函数联系起来。1. 能量概念的数学表达能量在物理学中是一个核心概念但它的数学本质其实更为基础。让我们先抛开物理实体从纯数学角度定义能量。在数学坐标系中我们可以定义任意点到原点的能量为该点坐标平方和import numpy as np def calculate_energy(point): return np.sum(point**2) # 示例计算点(3,4)的能量 point np.array([3, 4]) print(f点(3,4)的能量值为: {calculate_energy(point)})这个简单的定义实际上包含了几个关键特性非负性能量值总是非负的二次型能量是坐标的二次函数可加性在多维空间中总能量是各维度能量的和这些特性与物理学中的动能公式(½mv²)和弹簧势能公式(½kx²)惊人地相似。让我们用Matplotlib可视化这个能量函数import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D # 创建网格 x np.linspace(-5, 5, 100) y np.linspace(-5, 5, 100) X, Y np.meshgrid(x, y) Z X**2 Y**2 # 能量函数 # 绘制3D曲面 fig plt.figure(figsize(10, 7)) ax fig.add_subplot(111, projection3d) ax.plot_surface(X, Y, Z, cmapviridis) ax.set_title(二维空间中的能量函数曲面) ax.set_xlabel(X坐标) ax.set_ylabel(Y坐标) ax.set_zlabel(能量值) plt.show()2. 勾股定理与能量守恒勾股定理告诉我们在直角三角形中斜边平方等于两直角边平方和。从能量角度看这意味着能量可以在正交方向上分解而不损失。考虑一个向量v(a,b)我们可以将其分解到任意正交坐标系中。让我们用代码验证这一点def verify_pythagorean(a, b): # 原始向量 v np.array([a, b]) original_energy calculate_energy(v) # 旋转45度后的新坐标系 theta np.pi/4 # 45度 rotation_matrix np.array([ [np.cos(theta), -np.sin(theta)], [np.sin(theta), np.cos(theta)] ]) v_rotated rotation_matrix v rotated_energy calculate_energy(v_rotated) return original_energy, rotated_energy a, b 3, 4 orig_e, rot_e verify_pythagorean(a, b) print(f原始能量: {orig_e}, 旋转后能量: {rot_e})这个简单的实验验证了能量在正交变换下的守恒性。这种性质在信号处理中尤为重要因为它保证了信号经过正交变换如傅里叶变换后能量保持不变。3. 圆周等能量线与损失函数当我们固定能量值为某个常数时在二维空间中就得到了一个圆周。让我们绘制几个等能量线# 绘制等高线图 plt.figure(figsize(8, 6)) contour plt.contour(X, Y, Z, levels[1, 4, 9, 16], colors[r, g, b, m]) plt.clabel(contour, inlineTrue, fontsize10) plt.title(不同能量值对应的等高线) plt.xlabel(X坐标) plt.ylabel(Y坐标) plt.grid(True) plt.axis(equal) plt.show()在机器学习中损失函数曲面与这种能量曲面非常相似。以最简单的线性回归为例其均方误差(MSE)损失函数可以表示为$$ J(w) \frac{1}{N}\sum_{i1}^N (y_i - w^Tx_i)^2 $$其中w是权重参数。让我们用代码可视化这个损失函数# 生成简单的线性数据 np.random.seed(42) X_data 2 * np.random.rand(100, 1) y_data 4 3 * X_data np.random.randn(100, 1) # 计算不同权重下的MSE def mse_loss(w): return np.mean((y_data - w * X_data)**2) w_values np.linspace(0, 6, 100) loss_values [mse_loss(w) for w in w_values] # 绘制损失函数曲线 plt.figure(figsize(10, 6)) plt.plot(w_values, loss_values, b-) plt.title(线性回归的MSE损失函数) plt.xlabel(权重w) plt.ylabel(MSE损失) plt.grid(True) plt.show()4. 能量最低点与最优参数在物理学中系统倾向于处于能量最低的状态。类似地在机器学习中我们寻找使损失函数最小的参数值。让我们用数学推导和代码实验来验证这一点。对于一组点$x_1, x_2, ..., x_N$寻找一个点μ使得总能量$\sum_{i1}^N (x_i - μ)^2$最小。通过求导可以得到$$ \frac{d}{dμ}\sum_{i1}^N (x_i - μ)^2 -2\sum_{i1}^N (x_i - μ) 0 \ \Rightarrow μ \frac{1}{N}\sum_{i1}^N x_i $$这正是样本均值让我们用代码验证def find_min_energy_point(points): # 理论最小值点 theoretical_min np.mean(points) # 通过网格搜索寻找最小值 mu_values np.linspace(min(points), max(points), 1000) energies [np.sum((points - mu)**2) for mu in mu_values] empirical_min mu_values[np.argmin(energies)] return theoretical_min, empirical_min # 生成随机点 points np.random.normal(5, 2, 100) theory_mu, empir_mu find_min_energy_point(points) print(f理论最小能量点: {theory_mu:.4f}) print(f实验最小能量点: {empir_mu:.4f})这个实验验证了均值确实是使能量最小的点。在机器学习中这对应于最优参数的选择。5. 从二维到高维机器学习中的能量景观将二维空间的能量概念扩展到高维就得到了机器学习模型参数空间中的能量景观。让我们以简单的线性回归为例可视化两个参数时的损失曲面# 计算两个参数(w0, w1)的MSE def mse_2d(w0, w1): return np.mean((y_data - (w0 w1 * X_data))**2) # 创建参数网格 w0_values np.linspace(2, 6, 100) w1_values np.linspace(2, 4, 100) W0, W1 np.meshgrid(w0_values, w1_values) Z np.zeros_like(W0) for i in range(W0.shape[0]): for j in range(W0.shape[1]): Z[i,j] mse_2d(W0[i,j], W1[i,j]) # 绘制3D损失曲面 fig plt.figure(figsize(12, 8)) ax fig.add_subplot(111, projection3d) ax.plot_surface(W0, W1, Z, cmapviridis, alpha0.8) ax.set_title(线性回归的MSE损失曲面) ax.set_xlabel(截距w0) ax.set_ylabel(斜率w1) ax.set_zlabel(MSE损失) plt.show()这个曲面展示了参数空间中的能量景观训练模型的过程就是在这个景观中寻找最低点的过程。现代优化算法如梯度下降可以看作是在这个能量景观中的下山过程。6. 正则化能量约束下的优化在机器学习中我们经常在损失函数中加入正则化项这相当于在优化过程中对参数能量施加约束。以L2正则化为例$$ J(w) \text{MSE}(w) \lambda |w|^2 $$这实际上是在原始损失函数上增加了参数向量的能量项。让我们比较正则化前后的损失曲面def mse_with_l2(w0, w1, lambda_0.1): mse np.mean((y_data - (w0 w1 * X_data))**2) l2_penalty lambda_ * (w0**2 w1**2) return mse l2_penalty # 计算正则化损失 Z_reg np.zeros_like(W0) for i in range(W0.shape[0]): for j in range(W0.shape[1]): Z_reg[i,j] mse_with_l2(W0[i,j], W1[i,j]) # 绘制比较 fig plt.figure(figsize(16, 6)) ax1 fig.add_subplot(121, projection3d) ax1.plot_surface(W0, W1, Z, cmapviridis, alpha0.8) ax1.set_title(无正则化的损失曲面) ax2 fig.add_subplot(122, projection3d) ax2.plot_surface(W0, W1, Z_reg, cmapviridis, alpha0.8) ax2.set_title(带L2正则化的损失曲面) plt.tight_layout() plt.show()正则化后的曲面更加陡峭这有助于防止参数值过大从而提高模型的泛化能力。从能量角度看正则化限制了参数空间的能量分布。7. 正交变换与特征提取在机器学习中我们经常使用PCA等降维技术这些方法本质上利用了正交变换的能量保持特性。让我们用PCA对数据进行变换验证能量守恒from sklearn.decomposition import PCA # 创建二维数据 np.random.seed(42) data np.random.multivariate_normal(mean[0,0], cov[[1, 0.8], [0.8, 1]], size100) # 计算原始数据能量 original_energy np.sum(data**2) # 应用PCA pca PCA(n_components2) transformed pca.fit_transform(data) # 计算变换后能量 transformed_energy np.sum(transformed**2) print(f原始数据总能量: {original_energy:.4f}) print(fPCA变换后总能量: {transformed_energy:.4f})这个实验验证了正交变换确实保持了数据的总能量只是将能量重新分配到新的坐标轴上。在机器学习中这种性质使我们能够选择能量最集中的方向作为特征。8. 从能量角度看梯度下降梯度下降算法的每一步更新可以表示为$$ w_{t1} w_t - \eta \nabla J(w_t) $$从能量角度看这相当于在能量景观中沿着最陡的下降方向移动。让我们用代码实现并可视化这一过程def gradient_descent(X, y, learning_rate0.1, n_iter100): # 初始化参数 w np.random.randn(2, 1) history [w.copy()] for i in range(n_iter): gradients -2/X.shape[0] * X.T (y - X w) w w - learning_rate * gradients history.append(w.copy()) return np.array(history).squeeze() # 添加偏置项 X_b np.c_[np.ones((100, 1)), X_data] # 运行梯度下降 path gradient_descent(X_b, y_data, learning_rate0.1, n_iter50) # 绘制等高线和优化路径 plt.figure(figsize(10, 8)) plt.contour(W0, W1, Z, levels30, cmapcoolwarm) plt.plot(path[:, 0], path[:, 1], r-o, linewidth2, markersize4) plt.title(梯度下降在能量景观中的路径) plt.xlabel(w0 (截距)) plt.ylabel(w1 (斜率)) plt.grid(True) plt.show()这个可视化清晰地展示了梯度下降如何在能量景观中下山最终找到能量损失最小的点。学习率η控制了每一步的移动距离太大可能导致震荡太小则收敛缓慢。

如何付费使用DeepSeek-V4满血版！包括DeepSeek官网与硅基流动平台教程！Cherry Studio使用教程！

我们都知道，在网页中使用AI时，很容易遇到降智、输出长度受限等问题，简单来说就是不是满血版毕竟是免费使用，也能理解但是很多人都有使用满血版的刚需，因此该教程教大家如何使用 Cherry Studio 连接大模型的API&#…

2026/6/2 6:23:02 阅读更多

数据团队的新战场：上下文工程

还记得你的公司把 BI 工具直接连到生产数据库上的时候吗？ 数据总是错的。没人信任那些仪表板——所以我们构建了数据栈来解决这个问题。今天的 AI 智能体就相当于直接连到生产数据库的 BI 工具。每个公司现在都有了内部 AI 智能体，接入了原始上下文源…

2026/6/2 6:23:02 阅读更多

Halcon变异模型(Variation Model)的三种模式(standard/robust/direct)到底怎么选？看完这篇就懂了

Halcon变异模型模式选型指南：从统计原理到工业实践在工业视觉检测领域，Halcon的变异模型(Variation Model)一直是模板匹配技术的核心工具之一。当工程师面对create_variation_model中的三种模式(standard/robust/direct)时，选择困难往往源于对…

2026/6/2 6:21:41 阅读更多

【Sora 2音乐视频制作终极指南】：从零到爆款的7步工作流，含独家提示词库与节奏对齐算法

更多请点击： https://codechina.net 第一章：Sora 2音乐视频制作的核心范式演进 Sora 2不再将音乐与视觉视为独立模态的简单拼接，而是以统一时空潜变量（spatiotemporal latent）为根基，构建端到端的联合生成…

2026/6/2 7:19:07 阅读更多

3分钟学会使用res-downloader：跨平台资源下载神器的终极指南

3分钟学会使用res-downloader：跨平台资源下载神器的终极指南【免费下载链接】res-downloader 视频号、小程序、抖音、快手、小红书、直播流、m3u8、酷狗、QQ音乐等常见网络资源下载! 项目地址: https://gitcode.com/GitHub_Trending/re/res-downloader 你是…

2026/6/2 7:19:07 阅读更多

UI-TARS桌面应用终极指南：构建跨平台视觉语言模型GUI自动化工具

UI-TARS桌面应用终极指南：构建跨平台视觉语言模型GUI自动化工具【免费下载链接】UI-TARS-desktop The Open-Source Multimodal AI Agent Stack: Connecting Cutting-Edge AI Models and Agent Infra 项目地址: https://gitcode.com/GitHub_Trending/ui/UI-TARS-d…

2026/6/2 7:18:47 阅读更多

3步快速部署AI代码助手：DeepSeek-Coder-V2完全指南

3步快速部署AI代码助手：DeepSeek-Coder-V2完全指南【免费下载链接】DeepSeek-Coder-V2 DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence 项目地址: https://gitcode.com/GitHub_Trending/de/DeepSeek-Coder-V2 你是…

2026/6/2 7:18:26 阅读更多

虚拟同步发电机(VSG)振荡抑制与阻抗建模技术

1. 虚拟同步发电机技术背景与挑战虚拟同步发电机（Virtual Synchronous Generator, VSG）技术是近年来电力电子化电网中的一项重要创新。这项技术的核心思想是让并网逆变器模拟传统同步发电机的运行特性，从而为电力系统提供必要的惯性和阻尼支撑…

2026/6/2 7:18:26 阅读更多

roberta-base-go-emotions模型训练详解：如何从零开始构建情感分类AI

roberta-base-go-emotions模型训练详解：如何从零开始构建情感分类AI 【免费下载链接】roberta-base-go-emotions 项目地址: https://ai.gitcode.com/hf_mirrors/Beijing-Ascend/roberta-base-go-emotions roberta-base-go-emotions是一个基于RoBERTa架构的多…

2026/6/2 7:18:06 阅读更多

从 Prompt 到生产闭环：Spring AI Tool Calling 深度拆解与企业级落地

从 Prompt 到生产闭环：Spring AI Tool Calling 深度拆解与企业级落地摘要 Tool Calling 是大模型系统从“会回答”走向“会执行”的关键能力。很多文章只停留在 @Tool 注解和 Hello World 级别示例，但一旦进入生产环境，问题很快从“怎么调用”升级为“怎么控延迟、怎么控风…

2026/6/2 0:01:22 阅读更多

解耦安防碎片化：基于 Docker 与边缘计算的 AI 视频中台架构设计（支持 GB28181/RTSP 与源码交付）

在智能视频分析（IVA）与产业物联网（IoT）大行其道的今天，政企级安防项目的落地依然面临着严重的碎片化挑战。对于系统集成商和独立软件开发商（ISV）而言，传统的流媒体研发存在两大核心痛…

2026/6/2 0:03:04 阅读更多

解耦品牌壁垒：基于 Docker 与边缘计算的高并发视频中台架构（支持 GB28181/RTSP 统一接入与源码交付）

在泛安防与产业物联网（IoT）工程落地中，系统集成商与技术团队往往深陷于底层流媒体对接的碎片化泥潭。一方面，前端摄像机、IPC、NVR 品牌林立（如海康、大华、宇视等），其 GB28181 国标协议的信令交…

2026/6/2 0:03:04 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/2 3:04:55 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/2 3:51:01 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/2 1:12:03 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/2 5:03:37 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/2 0:27:25 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/2 2:18:01 阅读更多

相关文章