# 神经计算机让AI不再是工具而是计算机本身## 一、引言2026年4月7日一篇题为《Neural Computers》的论文悄然上线arXiv作者团队由Mingchen Zhuge等19人组成来自Meta AI与KAUST。这篇论文提出了一个野心勃勃的概念——神经计算机Neural Computers, NCs。如果说当下的AI Agent智能体是在“使用”计算机那么神经计算机试图做到的是让AI“成为”那台计算机本身。这一概念迅速引发学术界的广泛关注有评论称其可能超越Agent和世界模型开辟第三条技术路线。那么神经计算机究竟是什么它与我们熟知的计算机、AI Agent有何本质区别本文将为你全面拆解这一前沿概念。## 二、从“善假于物”到“自成一物”概念演进### 2.1 计算机的演化之路理解神经计算机首先要看清人与机器的关系经历了怎样的变化。第一阶段传统计算机。 人直接操作系统计算机执行显式编写的程序。计算、存储、输入输出各司其职这是冯·诺依曼架构统治的时代。第二阶段AI Agent时代。 最近几年大模型学会了调用工具——浏览器、操作系统、API、IDE——成为横亘在人与计算机之间的“中间层”。正如知乎上一位高赞回答所概括的“从前是人→电脑现在越来越像人→AI智能体→计算机”。但无论Agent多么强大它本质上仍然站在计算机系统之外任务的实际执行状态始终保存在操作系统或应用程序中而不在模型自身之内。第三阶段世界模型。 以Yann LeCun等人为代表的研究者倡导世界模型其核心关切的不是“替你完成任务”而是“环境会如何演化”。世界模型学习的是对未来的预测而非自身执行计算。这三种范式有一个共同的局限可执行状态始终存在于模型之外。正是在这个架构空白点上神经计算机的概念被提了出来。### 2.2 神经计算机的核心理念神经计算机的核心理念可以凝练成一句话将计算、内存与输入输出I/O统一整合到一个习得的潜空间运行时状态中让模型本身成为那台正在运行的计算机。通俗地理解传统计算机的CPU负责算内存负责存硬盘和屏幕负责输入输出三者通过总线来通信。而神经计算机设想用一个统一的神经网络来同时承担这三个角色——不是分别设计计算、存储和I/O模块而是让模型通过训练自动涌现出这些功能。知乎作者tomsheep的比喻非常精妙“荀子说‘君子生非异也善假于物也’。最近几年的AI在‘善假于物’这件事上做得越来越好而NC的立意要更高一层不是让AI使用电脑而是成为电脑本身。”## 三、前世今生神经计算机的技术谱系### 3.1 DeepMind的DNC早期探索2016年10月谷歌DeepMind团队在《自然》杂志上发表了一种名为可微分神经计算机Differentiable Neural Computer, DNC的学习机器堪称神经计算机概念的前身。DNC将神经网络与外部存储结构结合在一起前者通过示例或反复试验进行学习后者与传统计算机的随机存取存储器RAM相似。这使得机器既能像神经网络那样学习又能像传统计算机那样处理结构化数据。在实验中DNC在没有现成知识的情况下成功规划出伦敦地铁的最佳线路或根据符号语言描述解决方块拼图问题。然而DNC仍是一个神经网络外部存储的混合系统依赖显式的存储读写机制与今天Meta提出的“模型即计算机”有着根本差异。### 3.2 Meta NC从“调用”到“成为”的范式跃迁2026年的NC论文在立意上更加彻底。研究团队提出的长期目标称为完全神经计算机Complete Neural Computer, CNC——一种成熟的、通用的NC形态拥有稳定执行、显式重编程及持久复用能力。CNC必须满足四个严苛条件· 图灵完备具备通用计算能力· 通用可编程可被显式地重新编程· 行为一致性相同输入产生稳定、可预期的输出· 机器原生语义语义从数据中习得而非由人类显式编程目前团队已经构建了基于命令行界面CLI和图形界面GUI的原型系统。他们用大量真实操作轨迹训练模型让模型学习“人在电脑上做了什么操作屏幕通常会怎么变化”。实验结果表明模型已经能掌握I/O对齐、短距控制等基础能力。但这些还只是概念雏形距离真正的通用计算还有显著差距。### 3.3 四类系统的对比为了清晰定位NC的位置我们用一张表来总结系统类型 核心功能 执行状态位置 典型代表传统计算机 执行显式程序 操作系统内 PC、服务器AI Agent 操作外部环境 被调用的应用内 AutoGPT、Claude with tools世界模型 预测环境动态 不涉及执行 LeCun的JEPA架构神经计算机 模型自身就是运行时 模型内部 Meta NC原型阶段简而言之传统计算机执行程序Agent调用工具世界模型预测未来而神经计算机本身就成为运行的载体。## 四、关键技术原理### 4.1 统一运行时状态计算、内存与I/O的一体化NC最核心的创新在于提出了一种新的抽象将计算、内存和I/O统一在一个习得的潜空间运行时状态中。这并非简单的模块叠加而是从数据中习得整个执行逻辑。具体而言NC原型的实现方式是通过视频生成式建模将CLI或GUI的屏幕帧作为生成目标模型根据指令、像素信息和可用操作来预测下一帧画面。这跳过了对程序内部状态的显式追踪让模型通过观察海量I/O轨迹来隐式地学会“什么是计算”。传统计算机实例化的是局部的、组合的符号语义如二进制加法、逻辑门而神经计算机实现的是整体的、分布式的数值语义。在编程方式上前者的语义由人类显式设计后者的语义从数据中习得用户输入序列的含义。### 4.2 技术路线图通向完全神经计算机的路径从当前原型迈向CNC研究团队规划了一条清晰的技术路线· 突破上下文窗口限制通过实现无界的有效内存来扩展NC的执行能力· 组合式神经程序构建可复用、可组合的程序原语让NC学到的能力能被反复调用· 分离“运行”与“更新”在架构层面区分推理执行和参数更新避免每次运行都改变模型行为· 以交互I/O轨迹为主要训练数据坚持让系统通过真实交互习得底层计算逻辑### 4.3 当前局限与挑战研究者并未回避NC面临的严峻挑战。常规复用routine reuse、受控更新controlled update与符号稳定性symbolic stability是当前最突出的三大难题。模型的输出尚不能稳定地处理符号和逻辑学到的能力也还不能像函数调用一样被反复复用。## 五、不可忽视的基础神经形态计算硬件的并行革命如果说Meta的NC是在软件和架构层面“让模型成为计算机”那么神经形态计算Neuromorphic Computing则是在硬件层面“让芯片像大脑一样工作”。两者理念相通但层次不同前者关注的是软件层面的运行时抽象后者关注的是物理层面的仿生计算架构。### 5.1 为什么要“模仿大脑”当前AI硬件正面临严峻挑战。据TechTarget 2026年2月的分析美国数据中心用电已占全国总需求的约4.4%且仍在急剧增长。单个数据中心级GPU功耗可达300-700瓦大型训练集群需要数千个GPU并行散热和供电成本居高不下。相比之下人脑以约20瓦的功耗支撑千亿级神经元和千万亿级突触的复杂动态网络其能效远超现有任何AI系统。这种巨大的能效差距正是神经形态计算的核心驱动力。### 5.2 核心原理事件驱动与存内计算神经形态计算与传统冯·诺依曼架构的根本区别在于两点第一计算与存储一体化。 神经形态计算机没有单独的内存和处理单元这些任务在芯片上每个神经元的位置一起执行因此无需在内存和处理器之间传输数据大幅减少了能耗并加快了处理速度。第二事件驱动机制。 神经形态芯片采用脉冲神经网络SNN信息编码为离散的脉冲事件。没有脉冲输入时神经元不更新、不消耗能量。这与GPU/TPU“时钟一直在跑、无效计算一直在做”的模式形成鲜明对比。法国电子与信息技术实验室Leti的研究团队通过硅验证的神经形态系统在图像分类任务上较传统方案实现了能耗降低99.5%、推理时间减少76.7%的惊人效果【30†L25-L32】。### 5.3 值得关注的硬件突破剑桥大学氧化铪忆阻器2026年3月 一种受大脑启发的纳米电子元件有望将AI系统的能耗降低高达70%。该忆阻器的切换电流仅约10纳安培比传统氧化物装置低约一百万倍能产生数百个稳定的电导位阶用于模拟“内存内计算”。可编程超导神经元2026年4月 基于约瑟夫森结的超导神经元工作频率高达45 GHz每次脉冲能耗仅飞焦fJ级别同时支持10个体阈值和20个突触状态将计算、内存和可塑性融合于单一超导单元。单晶体管模拟神经突触2025年3月发表2026年5月重发新闻稿 新加坡国立大学团队在《Nature》发表成果证明单个标准硅晶体管以特定方式运行时可以同时模拟生物神经元和突触的行为为大规模神经形态芯片提供了极具可扩展性的方案。光子神经网络2026年2-5月 意大利CNR团队发现光子在光学电路中可自发表现为霍普菲尔德网络用光子作为“记忆神经元”新加坡国立大学团队则开发出光敏存储器开关首次在光学域内实现了完全的可重构非线性激活解决了光子神经网络长期缺失的关键一环。极端环境忆阻器2026年5月 南京邮电大学等团队开发出能在50°C到300°C极端温度下稳定工作的有机异质结忆阻器在300°C高温下仍能以93.22%准确率完成Fashion-MNIST分类任务。### 5.4 市场前景千亿赛道的加速市场数据印证了这一赛道的热度。据GII市场报告神经形态硬件市场从2025年的45.8亿美元增长至2026年的55.9亿美元年复合增长率达22.0%预计2030年将达122.6亿美元。神经形态计算市场从2025年的18.1亿美元增长至2026年的22.3亿美元年增长率为23.3%。更广泛的神经技术市场含脑机接口等2026年预计约198.4亿美元。## 六、神经计算机 vs 神经形态计算一张表格说清区别经过以上梳理我们可以清晰区分两个极易混淆的概念维度 神经计算机 (NC) 神经形态计算 (Neuromorphic Computing)定位 软件/架构层面的新范式 硬件/芯片层面的新架构核心思想 模型即运行时统一计算内存I/O 仿脑芯片事件驱动存内计算解决的问题 模型与计算环境的分离 冯·诺依曼瓶颈与功耗墙代表工作 Meta NC (2026) Intel Loihi、IBM TrueNorth、中科院达尔文猴成熟度 学术原型阶段 已有商用芯片生态仍在建设关系 理念相通NC未来可运行于神经形态硬件之上 ——## 七、未来展望与结语神经计算机代表了一种范式革命——当我们的AI系统不再只是调用外部工具而是本身成为可运行的计算机会带来怎样的可能性短期内NC能带来的直接价值在于打破模型与计算环境之间的壁垒。当前的AI Agent需要依赖操作系统、浏览器、API来执行任务模型本身并不承载可执行状态一切进展都由外部软件维护。一旦NC技术成熟模型将能够端到端地完成从感知到执行的完整闭环而不必经过层层“翻译”和外挂。这可能在自动化运维、软件测试、智能终端等场景率先落地。从更长期的视角看完全神经计算机CNC如果实现图灵完备、通用可编程和行为一致性它将构建出一个超越现有Agent、世界模型和传统计算机的全新计算范式。届时“编程”可能不再意味着用Python或C写代码而是通过交互和示例来“教会”一台神经计算机你想要什么。当然这条路还很长。当前NC原型只是一个学术概念验证从掌握I/O对齐到实现通用可编程中间还有大量的工程和理论难题需要攻克。但方向已经指明计算、内存、I/O三者终将被统一在一组神经网络权重之中。正如论文作者所说神经计算机的开发动机并非来自外部取代现有架构而是通过将分散功能内化于单一学习机器中实现统一。在下一次技术浪潮来临之前值得每一位开发者对这条路线保持关注。
神经计算机:让AI不再是工具,而是计算机本身
发布时间:2026/5/20 23:48:19
# 神经计算机让AI不再是工具而是计算机本身## 一、引言2026年4月7日一篇题为《Neural Computers》的论文悄然上线arXiv作者团队由Mingchen Zhuge等19人组成来自Meta AI与KAUST。这篇论文提出了一个野心勃勃的概念——神经计算机Neural Computers, NCs。如果说当下的AI Agent智能体是在“使用”计算机那么神经计算机试图做到的是让AI“成为”那台计算机本身。这一概念迅速引发学术界的广泛关注有评论称其可能超越Agent和世界模型开辟第三条技术路线。那么神经计算机究竟是什么它与我们熟知的计算机、AI Agent有何本质区别本文将为你全面拆解这一前沿概念。## 二、从“善假于物”到“自成一物”概念演进### 2.1 计算机的演化之路理解神经计算机首先要看清人与机器的关系经历了怎样的变化。第一阶段传统计算机。 人直接操作系统计算机执行显式编写的程序。计算、存储、输入输出各司其职这是冯·诺依曼架构统治的时代。第二阶段AI Agent时代。 最近几年大模型学会了调用工具——浏览器、操作系统、API、IDE——成为横亘在人与计算机之间的“中间层”。正如知乎上一位高赞回答所概括的“从前是人→电脑现在越来越像人→AI智能体→计算机”。但无论Agent多么强大它本质上仍然站在计算机系统之外任务的实际执行状态始终保存在操作系统或应用程序中而不在模型自身之内。第三阶段世界模型。 以Yann LeCun等人为代表的研究者倡导世界模型其核心关切的不是“替你完成任务”而是“环境会如何演化”。世界模型学习的是对未来的预测而非自身执行计算。这三种范式有一个共同的局限可执行状态始终存在于模型之外。正是在这个架构空白点上神经计算机的概念被提了出来。### 2.2 神经计算机的核心理念神经计算机的核心理念可以凝练成一句话将计算、内存与输入输出I/O统一整合到一个习得的潜空间运行时状态中让模型本身成为那台正在运行的计算机。通俗地理解传统计算机的CPU负责算内存负责存硬盘和屏幕负责输入输出三者通过总线来通信。而神经计算机设想用一个统一的神经网络来同时承担这三个角色——不是分别设计计算、存储和I/O模块而是让模型通过训练自动涌现出这些功能。知乎作者tomsheep的比喻非常精妙“荀子说‘君子生非异也善假于物也’。最近几年的AI在‘善假于物’这件事上做得越来越好而NC的立意要更高一层不是让AI使用电脑而是成为电脑本身。”## 三、前世今生神经计算机的技术谱系### 3.1 DeepMind的DNC早期探索2016年10月谷歌DeepMind团队在《自然》杂志上发表了一种名为可微分神经计算机Differentiable Neural Computer, DNC的学习机器堪称神经计算机概念的前身。DNC将神经网络与外部存储结构结合在一起前者通过示例或反复试验进行学习后者与传统计算机的随机存取存储器RAM相似。这使得机器既能像神经网络那样学习又能像传统计算机那样处理结构化数据。在实验中DNC在没有现成知识的情况下成功规划出伦敦地铁的最佳线路或根据符号语言描述解决方块拼图问题。然而DNC仍是一个神经网络外部存储的混合系统依赖显式的存储读写机制与今天Meta提出的“模型即计算机”有着根本差异。### 3.2 Meta NC从“调用”到“成为”的范式跃迁2026年的NC论文在立意上更加彻底。研究团队提出的长期目标称为完全神经计算机Complete Neural Computer, CNC——一种成熟的、通用的NC形态拥有稳定执行、显式重编程及持久复用能力。CNC必须满足四个严苛条件· 图灵完备具备通用计算能力· 通用可编程可被显式地重新编程· 行为一致性相同输入产生稳定、可预期的输出· 机器原生语义语义从数据中习得而非由人类显式编程目前团队已经构建了基于命令行界面CLI和图形界面GUI的原型系统。他们用大量真实操作轨迹训练模型让模型学习“人在电脑上做了什么操作屏幕通常会怎么变化”。实验结果表明模型已经能掌握I/O对齐、短距控制等基础能力。但这些还只是概念雏形距离真正的通用计算还有显著差距。### 3.3 四类系统的对比为了清晰定位NC的位置我们用一张表来总结系统类型 核心功能 执行状态位置 典型代表传统计算机 执行显式程序 操作系统内 PC、服务器AI Agent 操作外部环境 被调用的应用内 AutoGPT、Claude with tools世界模型 预测环境动态 不涉及执行 LeCun的JEPA架构神经计算机 模型自身就是运行时 模型内部 Meta NC原型阶段简而言之传统计算机执行程序Agent调用工具世界模型预测未来而神经计算机本身就成为运行的载体。## 四、关键技术原理### 4.1 统一运行时状态计算、内存与I/O的一体化NC最核心的创新在于提出了一种新的抽象将计算、内存和I/O统一在一个习得的潜空间运行时状态中。这并非简单的模块叠加而是从数据中习得整个执行逻辑。具体而言NC原型的实现方式是通过视频生成式建模将CLI或GUI的屏幕帧作为生成目标模型根据指令、像素信息和可用操作来预测下一帧画面。这跳过了对程序内部状态的显式追踪让模型通过观察海量I/O轨迹来隐式地学会“什么是计算”。传统计算机实例化的是局部的、组合的符号语义如二进制加法、逻辑门而神经计算机实现的是整体的、分布式的数值语义。在编程方式上前者的语义由人类显式设计后者的语义从数据中习得用户输入序列的含义。### 4.2 技术路线图通向完全神经计算机的路径从当前原型迈向CNC研究团队规划了一条清晰的技术路线· 突破上下文窗口限制通过实现无界的有效内存来扩展NC的执行能力· 组合式神经程序构建可复用、可组合的程序原语让NC学到的能力能被反复调用· 分离“运行”与“更新”在架构层面区分推理执行和参数更新避免每次运行都改变模型行为· 以交互I/O轨迹为主要训练数据坚持让系统通过真实交互习得底层计算逻辑### 4.3 当前局限与挑战研究者并未回避NC面临的严峻挑战。常规复用routine reuse、受控更新controlled update与符号稳定性symbolic stability是当前最突出的三大难题。模型的输出尚不能稳定地处理符号和逻辑学到的能力也还不能像函数调用一样被反复复用。## 五、不可忽视的基础神经形态计算硬件的并行革命如果说Meta的NC是在软件和架构层面“让模型成为计算机”那么神经形态计算Neuromorphic Computing则是在硬件层面“让芯片像大脑一样工作”。两者理念相通但层次不同前者关注的是软件层面的运行时抽象后者关注的是物理层面的仿生计算架构。### 5.1 为什么要“模仿大脑”当前AI硬件正面临严峻挑战。据TechTarget 2026年2月的分析美国数据中心用电已占全国总需求的约4.4%且仍在急剧增长。单个数据中心级GPU功耗可达300-700瓦大型训练集群需要数千个GPU并行散热和供电成本居高不下。相比之下人脑以约20瓦的功耗支撑千亿级神经元和千万亿级突触的复杂动态网络其能效远超现有任何AI系统。这种巨大的能效差距正是神经形态计算的核心驱动力。### 5.2 核心原理事件驱动与存内计算神经形态计算与传统冯·诺依曼架构的根本区别在于两点第一计算与存储一体化。 神经形态计算机没有单独的内存和处理单元这些任务在芯片上每个神经元的位置一起执行因此无需在内存和处理器之间传输数据大幅减少了能耗并加快了处理速度。第二事件驱动机制。 神经形态芯片采用脉冲神经网络SNN信息编码为离散的脉冲事件。没有脉冲输入时神经元不更新、不消耗能量。这与GPU/TPU“时钟一直在跑、无效计算一直在做”的模式形成鲜明对比。法国电子与信息技术实验室Leti的研究团队通过硅验证的神经形态系统在图像分类任务上较传统方案实现了能耗降低99.5%、推理时间减少76.7%的惊人效果【30†L25-L32】。### 5.3 值得关注的硬件突破剑桥大学氧化铪忆阻器2026年3月 一种受大脑启发的纳米电子元件有望将AI系统的能耗降低高达70%。该忆阻器的切换电流仅约10纳安培比传统氧化物装置低约一百万倍能产生数百个稳定的电导位阶用于模拟“内存内计算”。可编程超导神经元2026年4月 基于约瑟夫森结的超导神经元工作频率高达45 GHz每次脉冲能耗仅飞焦fJ级别同时支持10个体阈值和20个突触状态将计算、内存和可塑性融合于单一超导单元。单晶体管模拟神经突触2025年3月发表2026年5月重发新闻稿 新加坡国立大学团队在《Nature》发表成果证明单个标准硅晶体管以特定方式运行时可以同时模拟生物神经元和突触的行为为大规模神经形态芯片提供了极具可扩展性的方案。光子神经网络2026年2-5月 意大利CNR团队发现光子在光学电路中可自发表现为霍普菲尔德网络用光子作为“记忆神经元”新加坡国立大学团队则开发出光敏存储器开关首次在光学域内实现了完全的可重构非线性激活解决了光子神经网络长期缺失的关键一环。极端环境忆阻器2026年5月 南京邮电大学等团队开发出能在50°C到300°C极端温度下稳定工作的有机异质结忆阻器在300°C高温下仍能以93.22%准确率完成Fashion-MNIST分类任务。### 5.4 市场前景千亿赛道的加速市场数据印证了这一赛道的热度。据GII市场报告神经形态硬件市场从2025年的45.8亿美元增长至2026年的55.9亿美元年复合增长率达22.0%预计2030年将达122.6亿美元。神经形态计算市场从2025年的18.1亿美元增长至2026年的22.3亿美元年增长率为23.3%。更广泛的神经技术市场含脑机接口等2026年预计约198.4亿美元。## 六、神经计算机 vs 神经形态计算一张表格说清区别经过以上梳理我们可以清晰区分两个极易混淆的概念维度 神经计算机 (NC) 神经形态计算 (Neuromorphic Computing)定位 软件/架构层面的新范式 硬件/芯片层面的新架构核心思想 模型即运行时统一计算内存I/O 仿脑芯片事件驱动存内计算解决的问题 模型与计算环境的分离 冯·诺依曼瓶颈与功耗墙代表工作 Meta NC (2026) Intel Loihi、IBM TrueNorth、中科院达尔文猴成熟度 学术原型阶段 已有商用芯片生态仍在建设关系 理念相通NC未来可运行于神经形态硬件之上 ——## 七、未来展望与结语神经计算机代表了一种范式革命——当我们的AI系统不再只是调用外部工具而是本身成为可运行的计算机会带来怎样的可能性短期内NC能带来的直接价值在于打破模型与计算环境之间的壁垒。当前的AI Agent需要依赖操作系统、浏览器、API来执行任务模型本身并不承载可执行状态一切进展都由外部软件维护。一旦NC技术成熟模型将能够端到端地完成从感知到执行的完整闭环而不必经过层层“翻译”和外挂。这可能在自动化运维、软件测试、智能终端等场景率先落地。从更长期的视角看完全神经计算机CNC如果实现图灵完备、通用可编程和行为一致性它将构建出一个超越现有Agent、世界模型和传统计算机的全新计算范式。届时“编程”可能不再意味着用Python或C写代码而是通过交互和示例来“教会”一台神经计算机你想要什么。当然这条路还很长。当前NC原型只是一个学术概念验证从掌握I/O对齐到实现通用可编程中间还有大量的工程和理论难题需要攻克。但方向已经指明计算、内存、I/O三者终将被统一在一组神经网络权重之中。正如论文作者所说神经计算机的开发动机并非来自外部取代现有架构而是通过将分散功能内化于单一学习机器中实现统一。在下一次技术浪潮来临之前值得每一位开发者对这条路线保持关注。