Rune项目揭秘：大语言模型无数字算术运算的机制与挑战

发布时间：2026/6/7 19:17:26

无需数字的算术运算当大语言模型LLM仅依靠矩阵进行计算时其内部会发生什么作者是阿尔瓦罗·比德拉Alvaro Videla。这里提到了螺旋残余标记有图1展示。整数的相位表示螺旋线是傅里叶式数字编码的简化图示向量的一部分追踪圆周上的相位另一部分追踪粗略位置。整数137相位 49.3°余弦值 0.65正弦值 0.76粗略位置 13整数值 0 - 999。问题也随之而来。模型没有“手指”普通人学习算术可能借助身体如用手指计数等后来还会使用算盘等工具。但语言模型只有矩阵标记token输入激活值流动对数几率logit输出。然而向现代语言模型询问算术问题其内部会做出响应。这里给出了工作术语表包括标记Token、向量Vector、激活值Activation等的定义。与人类的对比乔治·莱考夫George Lakoff和拉斐尔·E·努涅斯Rafael E. Núñez在《数学从何而来》中指出人类数学概念源于身体体验。Transformer没有人类学习算术的工具若要学习算术需发明机器原生数字表示方式。人类有多种算术运算方式所以第一个科学问题是模型给出答案的方式。残差流在询问数字来源前需了解模型运行状态。逐标记读取提示信息时模型不会创建整洁变量每个标记位置携带长数字向量提示信息通过Transformer层时向量不断更新。残差流是这些变化累积的运行便签本这使得读出器和补丁操作可行但向量本身不能表明哪个主张正确。下一个标记的约束人类通常从右向左进行算术计算而语言模型需从左到右输出答案。答案呈现和精确计算不是同一问题随着答案变长模型内部数字块读出结果会受影响。单独计数实验也显示出类似压力在进位边界处模型易失败长连续输出时失败更明显。最初的梦想一个诱人的解决方案是调用计算器但Rune项目追求更严格的问题即深入模型内部找到其试图执行的计算让模型自身激活值提供操作和操作数信息。这与标准工具使用不同Rune项目询问工具参数能否来自模型内部状态。该梦想未完全实现但失败促使项目区分了三个方面。主张阶梯以同样的提示“ What is the gcd of 84 and 36?”作为测试案例有五种系统可输出答案区别在于操作和操作数来源以及模型哪部分被改变分别是提示解析器、生成程序、最终标记校正、激活值派生的工具参数、残差即时替换。第一个陷阱早期实验表明后期层写入状态可帮助模型输出数字块但这可能只是测量模型呈现给定值的能力不等同于模型计算出该值。Rune项目必须不断询问模型得出答案的方式规则变得更严格运行时提示必须不透明。过往工作的启示Rune项目并非首次提出螺旋结构想法坎塔姆内尼Kantamneni和泰格马克Tegmark、尼坎金Nikankin及其同事的研究有相关观点。这些工具也并非在此发明Rune项目的贡献是在无解析器来源规则下应用这些想法并报告更强的残差即时替换故事不成立的情况。工具包Rune项目大部分是反复应用的工具包有四种工具以不同方式作用于运行激活向量分别是探测器、稀疏自编码器SAE、补丁操作、引导操作每种工具都有用但不能过度断言。工具包模拟器残差流是模型的运行便签向量这四种工具以不同方式触碰该向量探测器问能否读取信息稀疏自编码器问能否为部分命名补丁操作问部分是否重要引导操作问推动会怎样。混淆这些问题会导致可解释性实验过度断言。可读与可写残差写入实验接近最初编译器设想但测试的单点写入操作未达预期残差干预在准确性上无优势且会干扰周围行为。可读的变量不一定是可写的寄存器机械可解释性注重读取工程需要写入。三个候选方案项目有三个合理方案提示解析可行但超出科学问题范围残差替换过于脆弱激活值派生的工具参数更清晰能说明算术提示可在残差流中留下可恢复结构并驱动计算器路线。工具使用背景现代工具使用系统已能将算术运算路由到外部计算但Rune项目问题更聚焦询问工具参数能否来自模型内部状态运行时边界很重要。幸存的方案重要问题是路由参数来源Rune项目支持激活值派生的无解析器工具参数。该方案在冻结的Llama模型中激活值派生的读出器可在无解析器规则下提供计算器参数在广泛算术/对抗性基准测试中通过测试在DeepMind切片上也有较好结果乘法因样本不足未纳入。还给出了应该触发和不应该触发的情况示例。诚实边界最重要的工程成果是回放边界来源是计算器参数来源的审计轨迹最终回放审计涵盖运行时包并排除禁止字段。独立硬负样本审计显示路由在不应该触发时未触发但这不是普遍安全保证。分辨率预算减法缩放运行发现精确自由生成在6位数字时保持较高水平随数字位数增加精确匹配率下降。螺旋分辨率测试表明表示方式未简单消失但相邻块读出质量变弱。前沿领域当前最终B3路线针对Llama模型项目尝试了多种模型家族一些发现有通用性但最终操作数定位路由未原样转移。最终因果证据有范围下一步要构建特定于模型的操作数定位器等。尽管有局限但Transformer的矩阵中包含算术痕迹。参考文献提及了具身数学、螺旋算术、启发式算术、因果算术机制、外部基准来源、工具路线、稀疏特征词汇表、激活值补丁规范等方面的参考文献。实验追踪给出了代码仓库、文章草稿、螺旋和分辨率工件、最终主张边界、基准测试结果、来源和控制、跨模型证伪、图表生成器等方面的实验追踪信息。

告别打字！用Chrome的SpeechRecognition API给你的网站加个‘语音输入框’

用Web Speech API打造下一代语音交互表单：从技术实现到体验优化在移动优先的时代，用户对输入体验的期待早已超越了传统的键盘敲击。想象一下：当用户在地铁里单手操作手机时，当老年用户面对复杂表单时，当司机需要通过车…

2026/6/7 19:16:25 阅读更多

如何快速掌握UKB_RAP：英国生物银行数据分析的完整指南

如何快速掌握UKB_RAP：英国生物银行数据分析的完整指南【免费下载链接】UKB_RAP Access share reviewed code & Jupyter Notebooks for use on the UK Biobank (UKBB) Research Application Platform. Includes resources from DNAnexus webinars, online train…

2026/6/7 19:15:45 阅读更多

UndertaleModTool终极指南：解锁GameMaker游戏修改的无限可能

UndertaleModTool终极指南：解锁GameMaker游戏修改的无限可能【免费下载链接】UndertaleModTool The most complete tool for modding, decompiling and unpacking Undertale (and other GameMaker games!) 项目地址: https://gitcode.com/gh_mirrors/un/Undertal…

2026/6/7 19:15:24 阅读更多

Windows安卓应用安装的革命性突破：APK安装器深度解析与技术实践

Windows安卓应用安装的革命性突破：APK安装器深度解析与技术实践【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 在当今跨平台应用生态快速发展的时代&#…

2026/6/7 20:33:23 阅读更多

几何光学仿真终极指南：5分钟学会专业级光学设计

几何光学仿真终极指南：5分钟学会专业级光学设计【免费下载链接】ray-optics A web app for creating and simulating 2D geometric optical scenes, with a gallery of (interactive) demos. 项目地址: https://gitcode.com/gh_mirrors/ra/ray-optics 还在为…

2026/6/7 20:32:42 阅读更多

千元迷你主机选购指南：英特尔N150芯片解析与三款热门机型横评

1. 从Twin Lake N150发布，聊聊千元迷你主机的“芯”选择2025年CES上，英特尔低调地更新了其入门级处理器产品线，推出了代号为Twin Lake的新架构，用以接替之前的Alder Lake-N。其中，N150这颗芯片，以其4核4线程…

2026/6/7 20:32:21 阅读更多

全平台B站客户端终极指南：wiliwili 10分钟快速上手教程

全平台B站客户端终极指南：wiliwili 10分钟快速上手教程【免费下载链接】wiliwili 第三方B站客户端，目前可以运行在PC全平台、PSVita、PS4 、Xbox 和 Nintendo Switch上项目地址: https://gitcode.com/GitHub_Trending/wi/wiliwili wiliwili是一…

2026/6/7 20:32:01 阅读更多

终极指南：如何用ViGEmBus在Windows上免费创建虚拟游戏手柄

终极指南：如何用ViGEmBus在Windows上免费创建虚拟游戏手柄【免费下载链接】ViGEmBus Windows kernel-mode driver emulating well-known USB game controllers. 项目地址: https://gitcode.com/gh_mirrors/vi/ViGEmBus 你是不是曾经遇到过这些困扰&#xff…

2026/6/7 20:31:20 阅读更多

如何用League Akari实现英雄联盟自动化辅助：从青铜到王者的智能游戏伴侣指南

如何用League Akari实现英雄联盟自动化辅助：从青铜到王者的智能游戏伴侣指南【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 你是否…

2026/6/7 20:30:37 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/7 0:02:57 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/7 0:02:57 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/7 0:03:38 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

2026/6/7 0:02:57 阅读更多

索引堆及其优化

2026/6/7 0:02:57 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

2026/6/7 0:03:38 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/7 9:41:13 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/7 9:41:15 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/7 9:41:13 阅读更多

相关文章

告别打字！用Chrome的SpeechRecognition API给你的网站加个‘语音输入框’

如何快速掌握UKB_RAP：英国生物银行数据分析的完整指南

UndertaleModTool终极指南：解锁GameMaker游戏修改的无限可能

Windows安卓应用安装的革命性突破：APK安装器深度解析与技术实践

几何光学仿真终极指南：5分钟学会专业级光学设计

千元迷你主机选购指南：英特尔N150芯片解析与三款热门机型横评

全平台B站客户端终极指南：wiliwili 10分钟快速上手教程

终极指南：如何用ViGEmBus在Windows上免费创建虚拟游戏手柄

如何用League Akari实现英雄联盟自动化辅助：从青铜到王者的智能游戏伴侣指南

LED驱动技术全解析：从核心架构到实战选型与避坑指南

索引堆及其优化

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

LED驱动技术全解析：从核心架构到实战选型与避坑指南

索引堆及其优化

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因