Miller Rabin：概率之下，证据成群

发布时间：2026/5/30 18:52:32

很多随机算法并不是靠“运气好”工作而是靠候选空间里存在大量可用证据。只要证据足够密集随机抽样就不再像碰运气而更像一种低成本的搜索策略。对于某个输入 xx如果额外给出一段信息 ww我们就能比直接求解更高效地验证某个结论。在计算复杂性中这类辅助信息通常被称为 witness也可以理解为“证人”或“证据”。算法不一定知道 witness 分布在哪里也不一定能直接构造 witness但它必须能够高效检查一个候选者是否为 witness。只要 witness 在候选集合里足够多随机抽一个候选者就有不错的概率命中。素数测试是这个思想的经典例子。我们想判断一个正整数 nn 是素数还是合数。直接分解 nn 目前没有已知的经典多项式时间算法但证明“nn 是合数”有时可以很容易只要找到一个合适的 witness。素数测试问题给定整数 nn最直接的素数测试是试除法从 22 一直试到 nn只要发现某个 ii 整除 nn就知道 nn 是合数。is_prime(n):i 2while i sqrt(n):if n mod i 0:return falsei i 1return true从数值大小看这个算法的复杂度是 O(n)O(n)似乎还能接受但在这个问题的背景下输入的规模一般不是输入的数字 nn而是 nn 的位数。若输入长度记为 ll那么大约有 llog⁡nllogn。试除到 nn 等价于试到 2l/22l/2 量级。所以这是一个指数时间算法。因此高效的素数测试真正关心的是能否在 log⁡nlogn 的多项式时间内完成。这就要求我们不能逐个检查可能因子而要寻找更便宜的证据。什么样的 witness 才有用谁能证明“nn 是合数”一个自然的 witness 是 nn 的非平凡因子。若存在 aa 满足 1an1an 且 a∣na∣n那么 aa 可以直接证明 nn 是合数。检查它也很快只需要计算 nmodanmoda。问题在于因子作为 witness 太稀疏。假设 npqnpq其中 pp 和 qq 是两个很大的素数。候选集合可以取 2,…,n−12,…,n−1大小接近 nn但真正能整除 nn 的候选者可能只有很少几个。随机抽一个数命中因子的概率非常低。这说明 witness 的定义不能只满足“可验证”还要满足“数量多”。一个适合随机算法的 witness 定义通常要满足三个条件它能高效证明目标结论任意候选者是否为 witness 可以高效检查在候选集合中witness 的比例不能太低最好有常数级下界。如果候选集合为 CCwitness 集合为 W⊆CW⊆C我们希望存在常数 α0α0使得 ∣W∣/∣C∣≥α∣W∣/∣C∣≥α。这样随机抽取一个候选者命中 witness 的概率至少是 αα。换句话说随机算法并不害怕不知道 witness 在哪里它害怕的是 witness 太少。只要证据足够多随机性就能把“寻找证据”的成本降下来。Fermat 测试从素数的必要条件出发而确实有这样一个数学定理可以帮上忙。Fermat 小定理给了一个更好的方向。它的内容是若 nn 是素数并且 a≢0(modn)a≡0(modn)则有an−1≡1(modn)an−1≡1(modn)这给出了一个反向证据如果我们找到某个 aa使得 an−1≢1(modn)an−1≡1(modn)那么 nn 一定不是素数。这样的 aa 就可以作为 nn 为合数的 witness。于是可以写出一个简单的测试fermat_test(n, a):if pow_mod(a, n - 1, n) ! 1:return compositeelse:return probably_prime这里的pow_mod不是先算出巨大的 an−1an−1 再取模而是在每一步乘法后取模即使用快速模幂完成计算。因为指数 n−1n−1 有 O(log⁡n)O(logn) 位可以在 O(log⁡n)O(logn) 次模乘内完成这已经是输入长度的多项式时间。实际实现中通常还会先计算 gcd⁡(a,n)gcd(a,n)。如果 1gcd⁡(a,n)n1gcd(a,n)n那么我们已经找到了 nn 的一个非平凡因子可以立即判定 nn 是合数。固定取 a2a2 可以得到一个非常便宜的测试if pow_mod(2, n - 1, n) 1:return probably_primeelse:return composite如果返回composite结果是确定的如果返回probably_prime则不一定正确。因为存在合数 nn 也满足 2n−1≡1(modn)2n−1≡1(modn)这类数被称为以 22 为底的 Fermat 伪素数。这时随机选择 aa 可以减少对单个底数的依赖a random integer in [2, n - 2]if pow_mod(a, n - 1, n) 1:return probably_primeelse:return composite但仍然不够理想。有些合数会对大量底数通过 Fermat 条件。问题不是模幂计算不够快而是 witness 的定义还不够强。Fermat 测试看的是终点an−1an−1 是否等于 11。如果只看终点有些合数确实能伪装得很好。Miller-Rabin 测试的改进之处在于它不只看终点还检查通向这个终点的平方链是否像素数模数下那样“合法”。Miller-Rabin更强的合数证人Miller-Rabin 测试对 Fermat 条件做了加强将得到 an−1modnan−1modn 的过程分解。对于奇数 n≥5n≥5将 n−1n−1 提出 22 因子写成n−12tun−12tu其中 uu 是奇数。然后随机选择一个候选底数 aa先计算 x0aumodnx0aumodn然后不断平方xixi−12modnxixi−12modn可以推出最终的 xtan−1modnxtan−1modn。最终的结果和费马素数的判定是一致的但是在原基础上我们增加了对中间结果的判断。如果 nn 是素数那么这条平方链必须满足一些非常受限的结构。Miller-Rabin 的 witness 检查正是利用这些结构。witness(a, n):write n - 1 2^t * u, where u is oddx pow_mod(a, u, n)repeat t times:y x * x mod nif y 1 and x ! 1 and x ! n - 1:return truex yif x ! 1:return truereturn falsewitness(a, n)返回true表示 aa 成功证明了 nn 是合数。这里有两类失败模式。第一类是 Fermat 条件本身失败最终得到的 an−1modnan−1modn 不是 11那么 nn 必然是合数。第二类更微妙在平方链中出现了 11 的非平凡平方根。这是因为质数的一些特殊性质对于素数模数11 的平方根只能是 ±1±1也就是 11 和 n−1n−1 。出现其他平方根说明模数一定不是素数。这一点可以从 (x−1)(x1)≡0(modn)(x−1)(x1)≡0(modn) 看出来。若 nn 是素数则乘积为 00 意味着至少一个因子为 00于是 x≡1x≡1 或 x≡−1x≡−1。只有合数模数下才可能出现更复杂的零因子现象。因此如果在迭代过程中某一步有 y≡1(modn)y≡1(modn)而对应的 xx 既不是 11 也不是 n−1n−1那么 nn 一定不是质数。错误概率指数下降这样一来Miller-Rabin 的完整算法很短miller_rabin(n, s):if n 2:return compositeif n 2 or n 3:return primeif n mod 2 0:return compositerepeat s times:a random integer in [2, n - 2]if witness(a, n):return compositereturn probably_prime这个算法有单侧错误。若它返回composite一定正确因为已经找到了合数 witness。若它返回probably_prime则表示在 ss 次随机尝试中都没有找到 witness。更准确地说若 nn 是素数任何合法底数都不会让 Miller-Rabin 返回composite。错误只可能发生在另一侧nn 实际上是合数但随机选择的底数都没有暴露它的合数性。对于任意奇合数 nn可以证明多四分之一的底数会让合数通过 Miller-Rabin 测试。也就是说至少四分之三的候选底数可以作为合数 witness。因此如果 nn 实际上是合数一次随机测试没有命中 witness 的概率至多为 1/41/4。独立重复 ss 次时全部失败的概率至多是P(error)≤(14)s4−sP(error)≤(41)s4−s这就是 witnesses 的力量。算法并不需要知道 witness 分布在哪里也不需要显式构造它们只要 witness 在候选集合里足够密集随机抽样就足以给出很强的概率保证。实际使用中s40s40 已经让错误概率小到可以忽略。若应用场景需要更强保证可以继续增加 ss代价只是线性增加测试轮数。常用的底数选取和已知伪素数在实际应用中当需要完全确定地判断一个不超过某个上限的整数是否为素数时可以放弃随机抽样转而使用一组固定且经过验证的底数。此时 Miller-Rabin 测试退化为确定性算法因为对于该范围内的所有合数至少其中一个底数能充当 witness。常见确定性底数集合最大整数范围底数集合说明21523028987472, 3, 5, 7, 11常见于 32 位整数场景34747496603832, 3, 5, 7, 11, 132642642, 325, 9375, 28178, 450775, 9780504, 1795265022经过充分验证的 7 个底数集合212821282, 3, 5, 7, 11, 13, 17未严格证明但实践中几乎总是可靠33170440646798873859619812, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37由 J. Sorenson 和 J. Webster 验证的一组底数覆盖极大范围已知的强伪素数Strong Pseudoprime即便使用了 Miller-Rabin某些合数仍能针对一组特定底数“伪装”成素数。这些数被称为强伪素数。以 2 为底的强伪素数最小的是 2,04723×892,04723×89。也就是说Miller-Rabin 测试若只用 a2a2会把 2047 判为素数。以 2 和 3 为底的强伪素数最小的是 1,373,653829×1,6571,373,653829×1,657。同时以 2、3、5、7 为底的强伪素数已知最小的是 3,215,031,751151×751×28,3513,215,031,751151×751×28,351。总的来说Miller-Rabin 之所以能从“概率算法”走向“工程上可信任的实用工具”正是基于一个根本事实合数的 witness 在底数空间中占据压倒性多数至少 75%。只需少量随机抽样就能以指数速度衰减的误差概率获得正确判定。这些例子表明了为何不能依赖少数几个固定底数做广泛范围的素数测试。对于超出上述表格范围的整数仍然应该使用随机底数保证高概率正确。确定性素数测试长期以来一个自然问题是这些 witness 是否只是“随机上很多”还是存在某种可被确定性利用的结构2002 年AKS 素数测试给出了确定性多项式时间算法证明素数判定确实属于 P。这在理论上非常重要因为它不依赖随机抽样也不再输出probably_prime而是确实有多项式时间准确判定是否是素数的方法。不过理论复杂度和工程表现是两回事。AKS 的历史意义不等于它在常规应用中优于 Miller-Rabin。实际系统里Miller-Rabin 仍然常用因为它实现简单、速度快并且错误概率可以通过重复测试降到极低。对于许多固定字长整数还可以选择一组已知底数使 Miller-Rabin 在该范围内变成确定性测试。同时Abundance of Witnesses 给出的不是某个特定算法技巧而是一种设计算法的角度如果直接求解困难就寻找一种容易验证且大量存在的证据。素数测试里因子是证据但太少Fermat witness 更便宜但不够强Miller-Rabin witness 把“证据密度”和“验证效率”平衡到了一个适合随机算法的位置。随机性在这里不是替代证明而是用来快速找到证明。

基于QT Py RP2040与VCNL4040打造低成本可定制接近开关方案

1. 项目概述：为什么我们需要一个可定制的接近开关？在辅助技术领域，一个核心的挑战是如何为不同能力、不同需求的用户，提供真正适配其身体条件和操作习惯的输入设备。市面上的商业产品，比如那些动辄数百美元的接近开关和…

2026/5/30 18:51:31 阅读更多

AI工具选型避坑指南（2024企业级落地白皮书）：6大维度拆解Hugging Face、Replicate、Azure AI Studio的隐性成本与SLA陷阱

更多请点击： https://codechina.net 第一章：AI工具选型避坑指南（2024企业级落地白皮书）：6大维度拆解Hugging Face、Replicate、Azure AI Studio的隐性成本与SLA陷阱企业在将AI模型投入生产时，常因低估平台…

2026/5/30 18:51:31 阅读更多

【Agent 开发】一文看懂三种 RAG 架构：Classic RAG、Graph RAG 与 Agentic RAG

文章目录前言一、Classic RAG：先检索，再生成1.1 Classic RAG 的基本链路1.2 Classic RAG 适合什么场景？1.3 Classic RAG 的边界在哪里？二、Graph RAG：把知识从文本片段变成关系网络2.1 Graph RAG 的核心：实…

2026/5/30 18:51:31 阅读更多

Sketch设计文件命名混乱？Rename It插件批量重命名优化路径解密

Sketch设计文件命名混乱？Rename It插件批量重命名优化路径解密【免费下载链接】RenameIt Keep your Sketch files organized, batch rename layers and artboards. 项目地址: https://gitcode.com/gh_mirrors/re/RenameIt 面对复杂的Sketch设计文件&#xf…

2026/5/30 19:43:00 阅读更多

Wand-Enhancer：WeMod高级功能扩展的本地化解决方案

Wand-Enhancer：WeMod高级功能扩展的本地化解决方案【免费下载链接】Wand-Enhancer Advanced UX and interoperability extension for Wand (WeMod) app 项目地址: https://gitcode.com/gh_mirrors/we/Wand-Enhancer Wand-Enhancer是一款专为WeMod应用设计的…

2026/5/30 19:43:00 阅读更多

DDPG算法里的‘演员’和‘评论家’到底在吵什么？用Python代码逐行拆解训练过程

DDPG算法里的‘演员’和‘评论家’到底在吵什么？用Python代码逐行拆解训练过程想象一下，你正在导演一场没有剧本的即兴戏剧。演员（Actor）需要在舞台上即兴发挥，而评论家（Critic）则在台下实时点评…

2026/5/30 19:42:20 阅读更多

AI写论文福利来啦！这4款AI论文写作工具，助你快速出稿！

四款AI论文写作工具推荐及测评在撰写期刊论文、毕业论文或职称论文的过程中，学术人员往往遇到不少困扰。人工写作面临大量参考文献，寻找相关资料如同在大海中捞针；严格的格式标准让人焦虑不已；而频繁的内容修改则消磨着写作的耐…

2026/5/30 19:40:39 阅读更多

北斗同步时钟推荐

首推西安同步电子科技的SYN4505A型北斗同步时钟。SYN4505A型北斗同步时钟采用10.1寸大触摸屏及按键设计，内置多模卫星接收机，可同时接受北斗/GPS/GLONASS等卫星信号，硬件同步＜30ns，具备8种告警模式，可对波特…

2026/5/30 19:40:39 阅读更多

Go语言微服务架构设计与实践

Go语言微服务架构设计与实践微服务架构是现代应用开发的主流范式，Go语言凭借其高性能和并发特性成为构建微服务的理想选择。本文将深入探讨如何使用Go语言设计和实现微服务架构。一、微服务架构概述微服务架构将应用拆分为多个独立的服务，每个服务专注…

2026/5/30 19:40:18 阅读更多

Win11/Win10深度学习环境搭建：实测PyCharm远程连接WSL2下的CUDA，性能比虚拟机强多少？

Win11/Win10深度学习环境终极对决：WSL2 CUDA vs 虚拟机 vs 双系统实测指南当开发者需要在Windows系统上进行深度学习开发时，通常会面临三种选择：虚拟机方案、双系统方案和WSL2方案。本文将基于实际测试数据，从GPU性能、开发便利性…

2026/5/30 0:00:39 阅读更多

SketchUp STL插件终极指南：3D打印工作流完全掌握

SketchUp STL插件终极指南：3D打印工作流完全掌握【免费下载链接】sketchup-stl A SketchUp Ruby Extension that adds STL (STereoLithography) file format import and export. 项目地址: https://gitcode.com/gh_mirrors/sk/sketchup-stl SketchUp STL插件…

2026/5/30 0:00:39 阅读更多

基于ICL8038的多波形信号发生器：从原理到制作的完整指南

1. 项目概述：从零构建一个基于ICL8038的多波形信号发生器在电子实验、设备调试乃至生物医学信号处理领域，一个稳定可靠、波形纯净的信号源是不可或缺的“心脏”。无论是用于测试放大器的频率响应，还是模拟生理电信号进行算法研究，…

2026/5/30 0:01:40 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/30 11:31:24 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/30 17:07:03 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/30 13:31:32 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/30 3:46:38 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/30 3:48:20 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/29 13:19:05 阅读更多

相关文章

基于QT Py RP2040与VCNL4040打造低成本可定制接近开关方案

AI工具选型避坑指南（2024企业级落地白皮书）：6大维度拆解Hugging Face、Replicate、Azure AI Studio的隐性成本与SLA陷阱

【Agent 开发】一文看懂三种 RAG 架构：Classic RAG、Graph RAG 与 Agentic RAG

Sketch设计文件命名混乱？Rename It插件批量重命名优化路径解密

Wand-Enhancer：WeMod高级功能扩展的本地化解决方案

DDPG算法里的‘演员’和‘评论家’到底在吵什么？用Python代码逐行拆解训练过程

AI写论文福利来啦！这4款AI论文写作工具，助你快速出稿！

北斗同步时钟推荐

Go语言微服务架构设计与实践

Win11/Win10深度学习环境搭建：实测PyCharm远程连接WSL2下的CUDA，性能比虚拟机强多少？

SketchUp STL插件终极指南：3D打印工作流完全掌握

基于ICL8038的多波形信号发生器：从原理到制作的完整指南

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

附录 B：术语表

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥