从‘挖土填土’到最优传输：用大白话和NumPy一步步实现Wasserstein距离计算

发布时间：2026/5/28 8:45:18

用NumPy实战Wasserstein距离从生活比喻到代码实现在机器学习的世界里我们常常需要比较两个概率分布的相似程度。就像在超市挑选水果时你会不自觉比较两堆苹果的分布——是左边那堆更大更均匀还是右边那堆更符合你的预期传统方法如KL散度和JS散度就像是用尺子测量苹果的大小而Wasserstein距离则更像考虑搬运这些苹果所需的工作量。本文将带你用NumPy一步步实现这个直观又强大的度量工具。1. 为什么需要新的分布距离度量KL散度就像一位严格的老师当学生答案与标准答案稍有不同时就给出极低分数。它定义为def kl_divergence(p, q): return np.sum(p * np.log(p / q))但这种方法有两个明显缺陷不对称性kl_divergence(p,q) ≠ kl_divergence(q,p)当分布完全不重叠时计算结果会爆炸无穷大JS散度试图改进这一点def js_divergence(p, q): m 0.5 * (p q) return 0.5 * (kl_divergence(p, m) kl_divergence(q, m))虽然解决了对称性问题但当两个分布相距较远时JS散度会卡在固定值无法提供有意义的梯度信号。这正是GAN训练早期常遇到的梯度消失问题的根源。2. Wasserstein距离的直观理解想象你在工地指挥土方运输土堆位置P分布土量Q分布土量需要运输量区域A312区域B24-2区域C110运输方案从区域A运2单位到区域B距离B-A1单位总成本运输量 × 距离 2×1 2这就是Wasserstein距离的核心思想——计算将一个分布重塑成另一个分布的最小工作量。3. 离散Wasserstein距离的数学框架对于两个离散概率分布P和Q计算步骤可分为3.1 构建成本矩阵假设我们有位于一维直线上的三个点locations np.array([0, 1, 2]) # 各点的位置 p np.array([0.5, 0.3, 0.2]) # 分布P q np.array([0.2, 0.5, 0.3]) # 分布Q # 计算两两之间的距离矩阵 cost_matrix np.abs(locations[:, None] - locations[None, :])得到的成本矩阵显示每单位质量从一个位置移动到另一个位置的距离[[0. 1. 2.] [1. 0. 1.] [2. 1. 0.]]3.2 求解最优传输计划这相当于一个线性规划问题最小化∑(运输量 × 距离) 约束条件 1. 从每个点运出的总量等于该点的P分布量 2. 运入每个点的总量等于该点的Q分布量使用SciPy的线性规划求解器from scipy.optimize import linprog # 将矩阵展平 cost cost_matrix.flatten() # 约束条件行和列的和 A_eq [] # 行约束 (P) for i in range(len(p)): constr np.zeros_like(cost) constr[i*len(q):(i1)*len(q)] 1 A_eq.append(constr) # 列约束 (Q) for j in range(len(q)): constr np.zeros_like(cost) constr[j::len(q)] 1 A_eq.append(constr) b_eq np.concatenate([p, q]) # 求解 result linprog(cost, A_eqA_eq, b_eqb_eq, bounds(0, None)) transport_plan result.x.reshape(cost_matrix.shape)得到的传输计划矩阵显示最优的质量转移方案。4. 实际应用与验证4.1 计算Wasserstein距离wasserstein_dist np.sum(transport_plan * cost_matrix) print(fWasserstein距离: {wasserstein_dist:.4f})4.2 与SciPy内置函数对比from scipy.stats import wasserstein_distance # 对于一维特例可以直接计算 wd wasserstein_distance(locations, locations, p, q) print(fSciPy计算结果: {wd:.4f})两种方法结果应该一致验证了我们实现的正确性。5. 进阶应用场景5.1 评估生成模型与传统指标相比Wasserstein距离能更好捕捉生成图像的细微质量差异评估指标对微小变化的敏感度计算成本梯度性质KL散度低低不稳定JS散度中等中等消失Wasserstein距离高高平滑5.2 聚类评估在比较聚类结果与真实标签时def cluster_quality(true_labels, pred_labels): # 将标签转换为概率分布 true_dist np.bincount(true_labels) / len(true_labels) pred_dist np.bincount(pred_labels, minlengthlen(true_dist)) / len(pred_labels) return wasserstein_distance(np.arange(len(true_dist)), np.arange(len(pred_dist)), true_dist, pred_dist)6. 性能优化技巧对于大规模问题精确计算可能代价高昂。可以考虑Sinkhorn近似通过熵正则化加速计算def sinkhorn(p, q, cost_matrix, reg0.1, max_iter100): K np.exp(-cost_matrix / reg) u np.ones_like(p) for _ in range(max_iter): v q / (K.T u) u p / (K v) return np.sum(u[:, None] * K * cost_matrix * v[None, :])分层方法先在大尺度上计算再逐步细化在图像处理任务中可以先将图像降采样计算近似距离再对关键区域进行精细计算。这种方法通常能节省90%以上的计算时间同时保持95%以上的准确度。

TPFanCtrl2：ThinkPad用户的终极风扇控制解决方案

TPFanCtrl2：ThinkPad用户的终极风扇控制解决方案【免费下载链接】TPFanCtrl2 ThinkPad Fan Control 2 (Dual Fan) for Windows 10 and 11 项目地址: https://gitcode.com/gh_mirrors/tp/TPFanCtrl2 TPFanCtrl2是一款专为ThinkPad笔记本设计的Windows风扇控制…

2026/5/28 8:43:16 阅读更多

Go语言make/new源码：内存分配机制深度解析

Go语言make/new源码：内存分配机制深度解析一、引言：Go语言内存分配的核心概念在Go语言中，make 和 new 是两个最基础但又容易混淆的内置函数。它们都用于内存分配，但适用场景和实现机制却有本质区别。深入理解这两个函数的底层实现…

2026/5/28 8:43:16 阅读更多

ARM MPU配置导致HardFault问题分析与解决

1. ARM MPU配置导致HardFault问题解析最近在调试基于STM32F7系列芯片的项目时，遇到了一个典型的MPU配置问题：当我把片上RAM区域配置为Shareable属性后，程序在访问该内存区域时触发了HardFault异常。这个问题在Keil MDK 5.23及以上版本中较为…

2026/5/28 8:42:15 阅读更多

终极文档下载解决方案：一键获取30+平台文档的免费工具

终极文档下载解决方案：一键获取30平台文档的免费工具【免费下载链接】kill-doc 看到经常有小伙伴们需要下载一些免费文档，但是相关网站浏览体验不好各种广告，各种登录验证，需要很多步骤才能下载文档，该脚本就是为了解…

2026/5/28 12:08:40 阅读更多

【手把手RAG搭建】从零手搓本地知识库（第三篇）：ChromaDB 记忆中枢与极速检索实战

上一篇：【手把手RAG搭建】从零手搓本地知识库（第二篇）：CPU极速语义切片与向量化实战导读：向量算出来了，然后呢？难道每次问答都要把几万条数据全扫一遍吗？这是《从零构建个人知识库》…

2026/5/28 12:08:18 阅读更多

2026年最佳Shopify联盟营销工具推荐（附详细对比）

在 2026 年的跨境电商大环境下，独立站商家如何破局？联盟营销（Affiliate Marketing）成为了 2026 年各大 DTC 品牌和 Shopify 商家保住 ROI 的杀手锏。作为一种“按效果付费（Pay-for-performance）”的营销模式…

2026/5/28 12:08:18 阅读更多

如何通过DCIM管理系统实现数据中心的智能化环境监控与资源配置？

如何选择适合的DCIM管理系统在选择时，企业需要综合考虑多个因素。第一，功能是否符合企业需求重要。例如、部分系统具备实时监控功能、可以利用华为、艾默生厂家的解决方案提升数据中心的环境监控能力。同时，大榕树科技的模块化设计允许用户…

2026/5/28 12:07:54 阅读更多

如何三步实现本地音乐库歌词批量下载：LRCGET终极指南

如何三步实现本地音乐库歌词批量下载：LRCGET终极指南【免费下载链接】lrcget Utility for mass-downloading LRC synced lyrics for your offline music library. 项目地址: https://gitcode.com/gh_mirrors/lr/lrcget 你是否拥有大量本地音乐文件却苦于没有…

2026/5/28 12:07:54 阅读更多

TestNG + 数据库 + 断言

1. pom.xml 依赖（全覆盖）xml<dependencies><dependency><groupId>org.testng</groupId><artifactId>testng</artifactId><version>7.8.0</version><scope>test</scope></dependency>…

2026/5/28 12:06:46 阅读更多

大模型核心加速器：KV Cache 如何将 O(n²) 计算复杂度降至 O(n)？

KV Cache 是大模型自回归生成任务的关键优化技术，通过“空间换时间”策略缓存历史 Key 和 Value 向量，将推理复杂度从 O(n) 降至 O(n)。文章阐述了语义缓存与前缀精确匹配两种核心范式，深入分析了 KV Cache 的技术底层原理、工程化应用及规模…

2026/5/28 0:00:48 阅读更多

物流系统如何打通信息孤岛？哲盟软件系统：一键打通内外部数据壁垒

在数字化转型加速的今天，物流企业面临的最大痛点之一就是信息孤岛——ERP、电商平台、智能硬件、OMS/TMS/WMS等系统各自为政，数据无法自由流转，导致人工操作繁琐、效率低下、出错率高。特别是在跨境物流领域，亚马逊、Shopee、TikT…

2026/5/28 0:02:48 阅读更多

Windows Defender终极恢复指南：5种强力方法解决禁用问题

Windows Defender终极恢复指南：5种强力方法解决禁用问题【免费下载链接】no-defender A slightly more fun way to disable windows defender firewall. (through the WSC api) 项目地址: https://gitcode.com/GitHub_Trending/no/no-defender 当你的Windo…

2026/5/28 0:04:54 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/28 4:33:02 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/28 3:32:24 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/28 3:32:25 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/27 20:16:23 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/27 15:51:09 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/27 12:55:08 阅读更多

相关文章