别再死记公式了！用Python从零推导极大似然估计，理解贝叶斯与线性回归的底层联系

发布时间：2026/5/27 18:17:35

用Python实战推导极大似然估计从硬币实验到线性回归在机器学习的世界里我们常常被各种复杂的数学公式所困扰。那些希腊字母和积分符号仿佛筑起了一道高墙将直观理解与理论推导分隔开来。但今天我们要用Python代码作为桥梁通过几个生动的实验重新发现**极大似然估计(MLE)**这一统计核心概念背后的简单之美。想象你手中有一枚可能被做过手脚的硬币——我们不知道它正面朝上的真实概率p是多少。通过观察一系列抛掷结果如何科学地推测这个隐藏的参数这就是MLE要解决的本质问题。与传统的数学推导不同我们将采用实验→代码→理论的逆向学习路径用NumPy模拟抛硬币实验直观感受最可能的含义通过SciPy优化器自动求解似然函数最大值揭示MLE与最小二乘法的内在联系对比频率学派与贝叶斯学派的思想差异import numpy as np from scipy import stats, optimize import matplotlib.pyplot as plt plt.style.use(seaborn)1. 从抛硬币实验理解似然函数1.1 模拟实验设置让我们设计一个简单的实验用参数p0.7的硬币进行100次抛掷现实中p未知这里仅为模拟。通过观察结果尝试反推这个p值。np.random.seed(42) true_p 0.7 # 真实概率(实践中未知) flips stats.bernoulli.rvs(true_p, size100) print(f正面次数:{sum(flips)}反面次数:{len(flips)-sum(flips)})输出示例正面次数:67反面次数:331.2 构建似然函数对于二项分布似然函数表示在给定参数p时观察到当前数据的概率$$ L(p) p^{\text{正次数}}(1-p)^{\text{反次数}} $$Python实现如下def likelihood(p, data): heads sum(data) tails len(data) - heads return (p**heads) * ((1-p)**tails)1.3 数值求解与可视化让我们扫描p从0到1的所有可能值观察似然函数的行为p_grid np.linspace(0, 1, 100) likes [likelihood(p, flips) for p in p_grid] plt.plot(p_grid, likes) plt.xlabel(p值) plt.ylabel(似然值) plt.vlines(true_p, 0, max(likes), linestylesdashed, colorsred) plt.title(似然函数曲线) plt.show()通过优化器自动寻找最大值点neg_likelihood lambda p: -likelihood(p, flips) # 转换为最小化问题 result optimize.minimize_scalar(neg_likelihood, bounds(0,1), methodbounded) print(f估计的p值: {result.x:.3f})输出结果估计的p值: 0.6701.4 关键发现观察现象统计意义似然曲线呈单峰状存在唯一最优解峰值接近0.7估计量具有一致性曲线宽度反映确定性样本量越大估计越精确注意当样本量较小时MLE估计可能不稳定。例如仅抛5次硬币时若全部为正面会得出p1的极端估计。2. 从MLE到MAP贝叶斯视角的扩展2.1 频率学派与贝叶斯学派的对比传统MLE是频率学派的代表只依赖观测数据。而最大后验估计(MAP)引入了先验知识形成两者的根本差异MLE$\hat{p} \arg\max P(D|p)$MAP$\hat{p} \arg\max P(p|D) \arg\max P(D|p)P(p)$2.2 添加Beta先验分布假设我们怀疑硬币可能有偏差采用Beta(2,2)作为先验等价于已见过2正2反def map_estimate(data, alpha2, beta2): heads sum(data) tails len(data) - heads return (heads alpha - 1) / (heads tails alpha beta - 2) print(fMAP估计: {map_estimate(flips):.3f})2.3 对比实验方法小样本(n5)大样本(n100)MLE1.00.67MAP0.750.66当数据量充足时MLE与MAP趋同而样本不足时先验知识能防止过拟合。3. 从概率角度推导线性回归3.1 建立概率模型假设目标变量$y$与特征$x$的关系为$$ y w^Tx \epsilon, \quad \epsilon \sim N(0, \sigma^2) $$这意味着$$ P(y|x,w) \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{(y-w^Tx)^2}{2\sigma^2}\right) $$3.2 构建对数似然函数对于独立同分布的n个样本对数似然为$$ \log L(w) -\frac{n}{2}\log(2\pi\sigma^2) - \frac{1}{2\sigma^2}\sum_{i1}^n (y_i-w^Tx_i)^2 $$最大化似然等价于最小化平方误差# 生成线性数据 np.random.seed(42) X 2 * np.random.rand(100, 1) y 3 * X np.random.randn(100, 1) # 最小二乘解 X_b np.c_[np.ones((100, 1)), X] # 添加偏置项 w_ols np.linalg.inv(X_b.T.dot(X_b)).dot(X_b.T).dot(y) print(fOLS系数: {w_ols.ravel()})3.3 梯度下降实现通过负对数似然的梯度下降验证def neg_log_likelihood(w, X, y): residuals y - X.dot(w) return 0.5 * np.sum(residuals**2) # 忽略常数项 # 自动微分求解 result optimize.minimize( neg_log_likelihood, x0np.random.randn(2), args(X_b, y), methodBFGS ) print(fMLE系数: {result.x})4. 工程实践中的注意事项4.1 数值稳定性技巧在实际编码中我们通常使用对数似然避免数值下溢def log_likelihood(p, data): heads sum(data) tails len(data) - heads return heads * np.log(p) tails * np.log(1-p)4.2 常见问题排查表问题现象可能原因解决方案似然函数平坦数据信息量不足增加样本量估计值在边界模型假设错误检查分布选择收敛速度慢特征尺度不一标准化数据4.3 不同分布的MLE实现分布类型似然函数Python实现要点正态分布二次形式估计μ和σ²泊松分布含阶乘使用log Gamma函数指数分布单调递减检查数据非负在真实项目中我曾遇到用户行为数据建模的问题。原始数据存在大量零值直接使用泊松分布导致拟合不佳。最终采用零膨胀模型将MLE分解为两部分from scipy.special import logsumexp def zero_inflated_log_lik(params, data): p_zero, mu params log_lik_zero np.log(p_zero (1-p_zero)*np.exp(-mu)) * (data0) log_lik_nonzero np.log(1-p_zero) stats.poisson.logpmf(data, mu) * (data0) return -np.sum(log_lik_zero log_lik_nonzero)这种实践中的灵活运用正是MLE强大适应性的体现。当理解其本质后你就能超越公式本身在各种场景中创造性地构建概率模型。

3步掌握Genanki：Python自动化创建Anki卡片的终极指南

3步掌握Genanki：Python自动化创建Anki卡片的终极指南【免费下载链接】genanki A Python 3 library for generating Anki decks 项目地址: https://gitcode.com/gh_mirrors/ge/genanki 还在为手动制作Anki卡片而烦恼吗？Genanki这个强大的Python库…

2026/5/27 18:17:13 阅读更多

Mobox Input Bridge终极触控配置指南：让手机秒变Windows触控神器

Mobox Input Bridge终极触控配置指南：让手机秒变Windows触控神器【免费下载链接】mobox 项目地址: https://gitcode.com/GitHub_Trending/mo/mobox 还在为在手机上操作Windows应用而烦恼吗？触控操作与键鼠逻辑的差异让你效率低下？别…

2026/5/27 18:16:17 阅读更多

如何5分钟掌握跨平台资源下载神器：res-downloader终极指南

如何5分钟掌握跨平台资源下载神器：res-downloader终极指南【免费下载链接】res-downloader 视频号、小程序、抖音、快手、小红书、直播流、m3u8、酷狗、QQ音乐等常见网络资源下载! 项目地址: https://gitcode.com/GitHub_Trending/re/res-downloader 你是否…

2026/5/27 18:16:17 阅读更多

智能驾驶的“第三只眼”：盲区监测技术全解析与实战指南

智能驾驶的“第三只眼”：盲区监测技术全解析与实战指南引言在智能驾驶技术飞速发展的今天，车辆感知能力依然是安全的核心。然而，传统后视镜存在难以消除的视觉盲区，每年由此引发的交通事故触目惊心。盲区监测（Blind …

2026/5/28 4:04:10 阅读更多

Bat批处理进阶玩法：用ren命令批量重命名，实现‘去头掐尾’和‘中间替换’

Bat批处理高阶实战：ren命令的五大文件命名改造术每次打开资源管理器，看到杂乱无章的文件名是不是让你血压飙升？那些自动生成的"IMG_20240401.jpg"、系统导出的"Report_V1_Final_Final(2).xlsx"，或是实验设备…

2026/5/28 4:03:09 阅读更多

LightRAG 入门指南：手把手教你用图增强 RAG 系统

LightRAG 入门指南：手把手教你用图增强 RAG 系统一、LightRAG 是什么？二、核心原理解析2.1 双层索引架构2.2 实体与关系抽取2.3 四种检索模式三、快速安装与配置3.1 安装3.2 使用 OpenAI API 配置（国际版）3.3 国内用户推荐方案四、…

2026/5/28 4:03:09 阅读更多

第6篇_Retain_Will_KeepAlive_工业现场为什么不能只会转发PUBLISH

一个 Broker 会转发 PUBLISH，只能说明它能跑通“实时消息”。但工业现场还会问：新客户端上线后，能不能马上拿到设备当前状态？设备异常掉线，其他客户端能不能收到通知？客户端死了不发包，Broker 会…

2026/5/28 4:01:08 阅读更多

数字隔离器的用途和技术指标有哪些

数字隔离器是一种基于半导体工艺（如电容耦合、磁耦合或智能分压技术）的电气隔离器件，用于在不同电位的电路之间安全传输数字信号，同时阻断直流和有害交流电流、抑制噪声与地环路干扰。---主要用途- 电气安全隔离：在高压…

2026/5/28 3:59:47 阅读更多

可视挖耳勺多少像素够用？可视耳勺好用吗？可视耳勺使用方法

不少入手过低劣可视挖耳勺的朋友，都会纠结这类产品究竟是不是智商税。画面模糊卡顿、勺体硬磨耳道、续航转瞬即逝、WiFi频繁断连、镜头发热严重，糟糕的使用体验让人直呼踩坑。但实际上，优质可视挖耳勺和普通传统挖耳工具相比，安全…

2026/5/28 3:58:46 阅读更多

大模型核心加速器：KV Cache 如何将 O(n²) 计算复杂度降至 O(n)？

KV Cache 是大模型自回归生成任务的关键优化技术，通过“空间换时间”策略缓存历史 Key 和 Value 向量，将推理复杂度从 O(n) 降至 O(n)。文章阐述了语义缓存与前缀精确匹配两种核心范式，深入分析了 KV Cache 的技术底层原理、工程化应用及规模…

2026/5/28 0:00:48 阅读更多

物流系统如何打通信息孤岛？哲盟软件系统：一键打通内外部数据壁垒

在数字化转型加速的今天，物流企业面临的最大痛点之一就是信息孤岛——ERP、电商平台、智能硬件、OMS/TMS/WMS等系统各自为政，数据无法自由流转，导致人工操作繁琐、效率低下、出错率高。特别是在跨境物流领域，亚马逊、Shopee、TikT…

2026/5/28 0:02:48 阅读更多

Windows Defender终极恢复指南：5种强力方法解决禁用问题

Windows Defender终极恢复指南：5种强力方法解决禁用问题【免费下载链接】no-defender A slightly more fun way to disable windows defender firewall. (through the WSC api) 项目地址: https://gitcode.com/GitHub_Trending/no/no-defender 当你的Windo…

2026/5/28 0:04:54 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/27 3:41:47 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/28 3:32:24 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/28 3:32:25 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/27 20:16:23 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/27 15:51:09 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/27 12:55:08 阅读更多

相关文章