8-机器学习与大模型开发数学教程-第0章预备知识-0-8 编程与数值计算基础（浮点数精度、溢出、数值稳定性）

发布时间：2026/5/25 21:56:30

「ml-llm-math.zip」链接https://pan.quark.cn/s/35fc37047e5e前几节我们复习了集合、逻辑、数列、复数这些是数学语言。但当我们真正写代码跑模型时还需要掌握数值计算的“底层规则”。这一节我们来聊三个非常关键但常被忽视的点浮点数精度溢出数值稳定性它们看似是编程细节其实直接影响到模型训练的效果甚至可能导致“损失函数 NaN”的惨剧。0-4 编程与数值计算基础1. 浮点数精度在计算机里数字并不是连续的而是有限的二进制表示。这就带来一个问题很多小数没法被精确表示。例子print(0.10.2)# 输出结果不是 0.3而是0.30000000000000004为什么因为二进制小数不能精确表示 0.1 和 0.2它们只能存储为近似值。生活类比就像你用“分米”为单位来丈量房间有些长度比如 2.75 米就量不准只能近似到 2.8 米。在机器学习中的影响参数更新当学习率非常小如1 e − 9 1e^{-9}1e−9更新值可能因为精度问题被“吞掉”参数不变。比较大小判断两个浮点数是否相等时要小心推荐用math.isclose()或设置一个容差。2. 溢出Overflow / Underflow溢出overflow数太大超过计算机能表示的范围。例如math.exp(1000)→ 会得到inf无穷大。下溢underflow数太小被当作 0。例如math.exp(-1000)→ 会得到0.0。importmathprint(math.exp(1000))# infprint(math.exp(-1000))# 0.0生活类比溢出像是往一个 500ml 杯子里倒 1000ml 水 → 溢出来了。下溢像是往杯子里倒一滴水 → 看起来就像没水。在机器学习中的影响softmax 函数softmax ( x i ) e x i ∑ j e x j \text{softmax}(x_i) \frac{e^{x_i}}{\sum_j e^{x_j}}softmax(xi)∑jexjexi如果x i x_ixi特别大e x i e^{x_i}exi会溢出成inf导致结果变成NaN。常见解决方案在 softmax 前减去最大值xx-np.max(x)exp_xnp.exp(x)softmaxexp_x/np.sum(exp_x)这样避免指数爆炸。3. 数值稳定性数值稳定性Numerical Stability指的是计算过程中是否会因为精度误差或溢出而导致结果不可靠。典型问题大数相减灾难性消除例如( 10 6 0.001 ) − 10 6 0.001 (10^6 0.001) - 10^6 0.001(1060.001)−1060.001但在计算机里由于10 6 10^6106太大0.001 可能被“忽略”导致结果变成 0。累加误差例如对一个大数组求和先加小数再加大数 vs 先加大数再加小数结果可能不同。这就是浮点数的加法不满足严格结合律( a b ) c ≠ a ( b c ) (ab)c \neq a(bc)(ab)ca(bc)。浮点精度溢出/下溢累积误差输入数据数值计算近似结果inf / 0不稳定结果图示说明数值计算中可能产生多种不稳定情况最终影响结果。在机器学习中的解决方法对数技巧log-trick在计算概率时经常用 log 形式log ⁡ ( a ⋅ b ) log ⁡ a log ⁡ b \log(a \cdot b) \log a \log blog(a⋅b)logalogb避免了直接相乘导致的 underflow。正规化在 softmax、batch normalization 中通过缩放数据避免极端值。高精度计算有些框架支持float64或混合精度训练mixed precision在效率和稳定性之间取平衡。小结浮点数精度计算机只能存近似小数可能导致0.1 0.2 ≠ 0.3 0.10.2 \neq 0.30.10.20.3。溢出/下溢数太大变成无穷大数太小变成 0。数值稳定性累积误差、灾难性消除会让计算结果不可靠。联系 AI 的意义在深度学习中训练失败的常见原因就是“数值不稳定”比如梯度爆炸、loss 变 NaN。掌握这些基础能帮助我们写出更健壮的训练代码。

若正整数k 的质因数分解中存在指数为奇数的质因子＜---什么是质因数分解，什么是质因子？

若正整数 k 的质因数分解中存在指数为奇数的质因子，则为无理数（如 12 ，指数 1 是奇数，故无理）。什么是质因数分解，什么是质因子？以下是针对质因数分解（prime factorization&#…

2026/5/25 21:55:50 阅读更多

SPT-AKI Profile Editor技术架构深度解析：基于MVVM的SPT存档管理系统设计

SPT-AKI Profile Editor技术架构深度解析：基于MVVM的SPT存档管理系统设计【免费下载链接】SPT-AKI-Profile-Editor Программа для редактирования профиля игрока на сервере SPT-AKI 项目地址: https://gitcod…

2026/5/25 21:55:30 阅读更多

基于LSTM与集成学习的风机预警预测：从时序数据到主动维护

1. 项目概述：从被动响应到主动预警的风机维护革命在风电场的日常运维中，工程师们最熟悉的场景莫过于监控屏幕上突然弹出的红色报警。这些报警信号，源自风机监控与数据采集系统，是设备健康状况的“哨兵”。然而，传统的报…

2026/5/25 21:55:30 阅读更多

拾亩绿光纯亚麻籽微粉哪里靠谱

很多人想通过亚麻籽补充营养，却常遇到传统亚麻籽粉易氧化、难吸收、口感差的问题。拾亩绿光纯亚麻籽微粉的出现，正是为解决这些痛点而来，其靠谱之处藏在技术、营养与体验的每一处细节里。靠谱首先源于硬核技术支撑。南京国英健康科技有限公司…

2026/5/26 2:27:55 阅读更多

揭秘生物年龄计算：BioAge工具包如何帮你量化衰老进程

揭秘生物年龄计算：BioAge工具包如何帮你量化衰老进程【免费下载链接】BioAge Biological Age Calculations Using Several Biomarker Algorithms 项目地址: https://gitcode.com/gh_mirrors/bi/BioAge 你是否曾好奇，为什么有些人60岁却拥有40岁的…

2026/5/26 2:27:55 阅读更多

【CP-05】RTE运行时环境 - SWC的操作系统接口

CP-05_RTE运行时环境【CP-05】RTE运行时环境 - SWC的“操作系统接口”前言在AUTOSAR架构中，RTE（Runtime Environment，运行时环境）是一个常被提及却难以理解的概念。它像是应用层软件组件（SW-C）与底层基础软…

2026/5/26 2:27:55 阅读更多

App Inventor蓝牙调试避坑指南：从连接失败到数据乱码，一次讲清所有常见问题

App Inventor蓝牙调试避坑指南：从连接失败到数据乱码的实战解决方案在移动应用开发领域，蓝牙通信一直是实现设备间短距离数据交换的核心技术之一。对于使用App Inventor的开发者而言，蓝牙模块提供了无需复杂编码即可实现无线通信的便捷途径。…

2026/5/26 2:27:14 阅读更多

别再乱算相似度了！用Python实战二元变量聚类：从Jaccard系数到病人分组

医疗数据分析实战：用Python实现基于Jaccard系数的病人症状聚类在医疗数据分析领域，如何从海量病人症状数据中发现潜在规律一直是临床研究的难点。传统方法往往依赖医生经验或简单统计，而现代数据挖掘技术为我们提供了更科学的解决方案。本文将…

2026/5/26 2:27:14 阅读更多

从AlphaFold到药物设计：一文读懂蛋白质结构预测如何改变生物医药

AlphaFold革命：蛋白质结构预测如何重塑生物医药研发范式在生物医药领域，蛋白质结构预测曾被称为"50年未解的生物学难题"。2020年，DeepMind的AlphaFold2在CASP14竞赛中达到原子级精度，这一突破不仅解决了结构生物学家的世…

2026/5/26 2:26:13 阅读更多

Claude Code Skill动态发现机制全解析：为什么你的AI会自动执行代码

文章目录前言一、那个让我怀疑AI成精的自动commit事件二、静态注入：Claude偷偷给模型塞的小纸条三、Skill工具：模型自己给自己发指令的自导自演四、动态注入：Skill集合变了怎么办？五、语义匹配注入：当Skill多到烧不起t…

2026/5/26 0:00:17 阅读更多

ssm高校普法系统（10101）

有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码SQL脚本）配套文档（LWPPT开题报告/任务书）远程调试控屏包运行一键启动项目&…

2026/5/26 0:01:18 阅读更多

强化学习策略参数调节方法及值迭代算法实现 CS188 Proj3 学习笔记

强烈推荐的更好的阅读体验 Q1.Value Iteration 第一个问题是最基础的值迭代实现，这个问题没有什么难度，主要就是一边看着公式一遍敲代码复现。可以先回顾一下Note8中的Value Iteration框架.唯一唯一需要注意的就是需要使用的是batch版本，而…

2026/5/26 0:01:39 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/25 1:05:07 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/25 1:05:13 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/26 1:30:55 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/25 15:34:05 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/25 15:07:25 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/25 11:05:00 阅读更多

相关文章

若正整数k 的质因数分解中存在指数为奇数的质因子＜---什么是质因数分解，什么是质因子？

SPT-AKI Profile Editor技术架构深度解析：基于MVVM的SPT存档管理系统设计

基于LSTM与集成学习的风机预警预测：从时序数据到主动维护

拾亩绿光纯亚麻籽微粉哪里靠谱

揭秘生物年龄计算：BioAge工具包如何帮你量化衰老进程

【CP-05】RTE运行时环境 - SWC的操作系统接口

App Inventor蓝牙调试避坑指南：从连接失败到数据乱码，一次讲清所有常见问题

别再乱算相似度了！用Python实战二元变量聚类：从Jaccard系数到病人分组

从AlphaFold到药物设计：一文读懂蛋白质结构预测如何改变生物医药

Claude Code Skill动态发现机制全解析：为什么你的AI会自动执行代码

ssm高校普法系统（10101）

强化学习策略参数调节方法及值迭代算法实现 CS188 Proj3 学习笔记

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

附录 B：术语表

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥