LeCun新证明：世界是高斯的

发布时间：2026/6/25 11:19:21

克雷西发自凹非寺量子位 | 公众号 QbitAILeCun的LeJEPA到底有没有构建出世界模型他本人最新发表的论文解答了这个问题。答案是肯定的但是有条件世界的底层变量需要服从高斯分布。论文给出了完整的数学证明覆盖了精确成立的条件和近似情况下误差的退化规律。同时LeCun他们还用机器人手臂控制实验验证了这一点——在目标导向的控制任务上用高斯采样训练出来的模型规划效果与已知真实状态的理想情况在统计上没有差异。这让LeCun押注多年的JEPA路线终于有了理论支撑。模型学没学到世界怎么判断判断一个机器学习模型的内部表示到底对不对得上真实世界的结构要看它能不能还原世界里的真实变量。一个模型在训练集上表现优秀并不代表它真正理解了世界可能只是把图像的纹理、光照、背景等无关信息混在一起恰好拼凑出了正确答案。一旦场景发生变化这样的表示就会失效。真正有用的表示应该对应世界的真实自由度比如物体的位置、速度、颜色这些独立的内在变量而不是它们被观测过程扭曲之后的混合产物。问题在于这些变量的观测本身就是一道屏障。我们看到的图像、传感器的读数都是世界真实状态经过复杂非线性变换之后的结果。这个变换可以非常复杂大量的结构信息在这个过程中被混淆、叠加。从这样的观测出发反推真实结构在数学上一般是无法保证的这正是表示学习长期面临的核心难题。对比学习、VICReg、BYOL等自监督学习的各种方法在这个问题上都绕开了正面回答。这些方法的共同特点是它们对模型输出的嵌入分布没有明确的约束只是通过各种技巧防止表示退化为常数。嵌入分布是什么形状、有什么性质这些方法并不关心。正因如此想要从理论上分析这些方法学到的表示是否还原了真实结构就缺乏足够的数学方法。LeJEPA的设计在这里走了一条不同的路。它通过一个叫SIGReg的正则项把模型输出的嵌入分布显式约束为各向同性高斯分布。这个约束让嵌入空间有了明确的几何结构也正是这个结构让严格的理论分析成为可能。选择高斯分布的一个前提是论文对世界的潜变量做了一个假设——它们服从高斯分布。这个假设的选择有两个理由。高斯分布是给定均值和方差条件下熵最大的分布这意味着它对潜变量的结构做出了最少的额外假设是一个尽可能保守的起点。与此同时任务相关的潜变量往往是大量微观变量聚合的结果根据中心极限定理这类聚合变量天然趋向高斯分布。高斯分布有效且唯一的答案在LeCun的论文中判断LeJEPA的表示是否还原了世界的真实结构的标准叫做线性可识别性。意思是说如果学到的表示和真实潜变量之间存在一个线性对应关系就认为模型还原了世界的真实结构。但这个标准的门槛并不低它要求表示空间里的每一个维度都对应真实世界里某一个独立的变量。用数学语言来表达就是存在一个矩阵Q使得真实潜变量经过Q的线性变换之后恰好等于模型输出的表示。用于判断线性可识别性的工具叫做线性探针即在冻结的表示上训练一个线性分类器或回归器用来衡量表示里包含了多少关于目标变量的信息。线性探针本身只能做线性变换这意味着它能提取到什么完全取决于表示里的信息——如果表示真的线性对应了真实变量线性探针就能准确提取反之亦然。论文中作者正是用线性探针来衡量LeJEPA的表示是否还原了真实潜变量的。实验的设置是这样的先在已知的低维高斯潜变量上施加非线性混合函数这些混合函数包括螺旋形变换、正弦剪切、抛物线剪切、RealNVP耦合层等多种形式目的是把潜变量变换成观测数据接着再用LeJEPA在这些观测数据上训练编码器最后在编码器输出的表示和原始潜变量之间拟合一个线性回归用R²衡量两者的线性对应程度。R²越接近1说明表示和真实潜变量之间的线性关系越强即线性可识别性越好。实验还把潜变量的维度从2一路扩展到1024远超DINOv2等模型的嵌入维度以验证结论是否随规模成立。结果显示在所有测试的混合函数和维度下SIGReg和VICReg的R²都保持在0.999以上线性可识别性在高斯潜变量的条件下稳定成立。从理论角度看对于高斯分布描述变量如何在时间上演化的转移算子有一组特殊的特征函数叫做Hermite多项式它们是高斯分布下函数空间的自然正交基类似于周期函数里的傅里叶级数。这组多项式的关键性质是一个函数里非线性成分的次数越高它在正样本对之间的相关性就越低。LeJEPA的对齐损失要最大化正样本对之间的相关性因此任何非线性扭曲都会被严格惩罚。再结合SIGReg对嵌入分布的约束这个线性映射必然是一个正交变换即真实潜变量的一个旋转。论文进一步证明了这个条件的唯一性。Sturm-Liouville理论是经典数学物理里分析微分算子特征函数的框架它描述了在什么条件下一个算子的特征函数具有特定的形状。论文借用这个框架证明要让转移算子的第一个特征函数恰好是仿射函数即线性函数加常数潜变量的分布必须满足一个非常严格的条件——它的对数密度的导数必须是线性的而满足这个条件的分布恰好只有高斯分布。这意味着高斯分布在这个问题里的地位是唯一的换成Laplace分布、均匀分布或其他任何非高斯分布线性可识别性的保证都无法成立。论文也用实验印证了这一点在广义正态分布族里扫描形状参数线性恢复的R²在形状参数等于2即高斯时出现尖锐的峰值偏离高斯之后迅速下降。在表示空间规划就是在真实世界规划线性可识别性一旦成立意味着什么这意味着在学到的表示空间里做规划得到的结果和在真实世界里求解最优控制完全等价。如果表示和真实潜变量之间只差一个旋转那么表示空间里的直线轨迹解码回真实空间之后仍然是一条直线而直线轨迹恰好是很多控制问题里的最优解。因此只要代价函数对旋转不敏感在表示空间里规划出来的最优策略就等同于在真实世界里规划出来的最优策略。论文用一个机器人手臂控制任务来验证这一点。实验的场景是DMC Reacher一个有两个关节的机械臂目标是从起始姿态运动到目标姿态。实验分两组第一组用各向同性随机采样OU过程生成训练数据潜变量的分布满足高斯假设第二组直接用强化学习策略跑出来的真实轨迹作为训练数据潜变量的分布因为策略的目标导向性而集中在状态空间的某个低熵区域不再满足高斯假设。结果显示第一组训练出来的编码器在表示空间里做直线插值规划得到的关节轨迹与已知真实状态的理想情况在统计上没有差异第二组训练出来的编码器同样的规划方法却产生了明显的偏差控制代价显著上升。同一套物理系统用随机探索的方式采样就能满足理论条件用目标导向的策略采样就会破坏条件。两者的区别正是在于数据的分布。这意味着在自监督预训练阶段数据采样策略本身就是理论保证的一部分。论文地址https://arxiv.org/abs/2605.26379一键三连「点赞」「转发」「小心心」欢迎在评论区留下你的想法—完—专属AI产品从业者的实名社群只聊AI产品最落地的真问题扫码添加小助手发送「姓名公司职位」申请入群进群后你将直接获得最新最专业的AI产品信息及分析不定期发放的热门产品内测码内部专属内容与专业讨论点亮星标科技前沿进展每日见

如何永久保存微信聊天记录：WeChatMsg让你的数据真正属于自己

如何永久保存微信聊天记录：WeChatMsg让你的数据真正属于自己【免费下载链接】WeChatMsg 提取微信聊天记录，将其导出成HTML、Word、CSV文档永久保存，对聊天记录进行分析生成年度聊天报告项目地址: https://gitcode.com/GitHub_Trending/we…

2026/6/23 3:10:18 阅读更多

Elsevier论文审稿状态追踪：5分钟安装免费Chrome插件，告别手动刷新焦虑

Elsevier论文审稿状态追踪：5分钟安装免费Chrome插件，告别手动刷新焦虑【免费下载链接】Elsevier-Tracker 项目地址: https://gitcode.com/gh_mirrors/el/Elsevier-Tracker 在科研投稿的漫长等待中，Elsevier Tracker这款强大的Chrome…

2026/6/22 12:21:08 阅读更多

PCL2启动器Forge安装终极指南：从新手到专家的完整解决方案

PCL2启动器Forge安装终极指南：从新手到专家的完整解决方案【免费下载链接】PCL Minecraft 启动器 Plain Craft Launcher（PCL）。项目地址: https://gitcode.com/gh_mirrors/pc/PCL 如果你正在使用Plain Craft Launcher 2（…

2026/6/23 21:58:09 阅读更多

Harness持续交付平台入门：从本地部署到金丝雀发布实战

1. 先搞清楚“Harness”到底指什么——别被名字骗了十年很多人第一次看到“Harness”这个词，下意识会联想到“马具”“束缚带”或者“拖拽装置”，甚至有人在技术群里问：“这玩意儿是不是要给服务器套个皮带？”——这种误解非常典型…

2026/6/24 23:17:45 阅读更多

TRAE Skills：Agent能力的可执行说明书与WASM契约设计

1. TRAE Skills不是插件，是Agent能力的“可执行说明书”最近在字节内部技术社区刷到一条消息：“TRAE上线Skills！”——没有预告、没有发布会PPT、连官方文档都还带着草稿水印，但工程师们已经自发建了十几个共享仓库，把…

2026/6/24 23:09:03 阅读更多

Vibe Coding 入门指南：用自然语言驱动开发的范式革命

1. 什么是 Vibe Coding？它和 Codex 的关系不是你想的那样“Vibe Coding”这个词最近在开发者社区里像野火一样烧起来，但很多人点开教程才发现——根本找不到官方定义。我第一次看到这个词是在一个凌晨三点的 Discord 频道里，有人贴出一段用自…

2026/6/24 23:07:50 阅读更多

深入解析PowerPC MPC823中断、寄存器与指令执行机制

1. 项目概述与核心价值如果你正在开发一个对实时性要求苛刻的嵌入式系统，比如工业运动控制器、通信基站的信令处理单元，或者高可靠性的汽车电子控制单元，那么处理器内核的中断响应速度和指令执行效率，就不仅仅是数据手册上的几个参…

2026/6/24 23:07:50 阅读更多

深入解析PowerPC e300核心寄存器模型与性能监控实战

1. 项目概述与核心价值在嵌入式系统开发，尤其是网络通信处理器和工业控制器的底层驱动与操作系统移植工作中，深入理解处理器核心的架构细节是区分普通应用开发与系统级开发的标志。今天，我们就来深入拆解一个在通信处理器领域具有代表性的核心…

2026/6/24 23:06:18 阅读更多

多比特图像水印技术：ADD方法原理与应用实践

1. 多比特图像水印技术概述数字水印技术作为数字版权保护的重要手段，通过在载体数据中嵌入不可见的标记信息，实现对内容的身份认证和溯源追踪。传统水印技术主要分为频域方法和空域方法两大类：频域方法如DWT-DCT通过离散小波变换和离散余弦变…

2026/6/24 23:05:57 阅读更多

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/25 1:04:34 阅读更多

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程【免费下载链接】diff-pdf A simple tool for visually comparing two PDF files 项目地址: https://gitcode.com/gh_mirrors/di/diff-pdf 还在为PDF文档的版本对比而烦恼吗？diff-pdf这款开…

2026/6/25 1:04:45 阅读更多

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/25 1:04:41 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/24 12:19:33 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…