李想一个半小时讲透真正的具身智能

发布时间：2026/6/29 19:34:08

说实话那天下午我坐在发布会现场听到李想开口第一句话就愣住了——他说今天的智能手机和智能汽车其实都不智能。台下很多人跟我一样先是愣了一下然后才慢慢反应过来没错我们喊了这么多年的“智能”骨子里还是一套功能驱动的机器逻辑。过去这十年行业提到智能汽车就三件事软件定义硬件、能联网、能OTA升级。可现在我们回过头看你手里的车真的变聪明了吗就拿辅助驾驶来说遇到稍微复杂点的突发状况它的常规操作是直接“退出”方向盘甩回给你——这操作完全合法合规但你敢说它不危险现在的智驾只会前进、左拐、右拐不会倒车也不会靠边停车。赶上你着急赶路走一段特别绕的窄路大部分人还是默默关掉智驾自己开因为那个通行效率实在让人着急。这些毛病不是靠一次次OTA打个补丁就能修好的是车从被设计出来的那一刻底层架构就写死了。所以理想这次给出的解法不是继续缝缝补补而是直接用“具身智能”重写底层架构。为了让大伙儿真明白什么是具身智能以及它跟造车到底有什么关系理想搞了一场“Livis Day”李想带着团队花了一个半小时把自研芯片、自研模型、全新交互、具身智能的定义一股脑全摊开了。发布会第二天我又挤进一个小型媒体群访听CTO谢炎和基座模型负责人詹锟聊了更多没来得及在台上说的话。先说那个最关键的东西——模型是具身智能的“大脑”。理想把这个大脑拆成了两块一块叫语言智能负责听懂你说的话推演接下来该怎么办另一块叫机器智能负责看清真实的物理世界然后精准地手脚并用去执行。语言智能这边分云端和车端两个模型。云端的那个叫马赫Mind-Pro詹锟他们给它跑了一圈权威测试在Agent专项评测里综合性能已经把不少主流大模型甩在身后了。让我印象特别深的是它的工程效率靠着一种Token压缩技术任务完成率一点没降可整体Token的消耗平均降了38%工具调用来回倒手的冗余轮次少了47%推理速度峰值能跑到208 token每秒效率是同级别主流Agent模型的两倍还多。车端的叫马赫Mind-Edge这可是个狠角色。它不是把云端模型砍几刀丢过来的“阉割版”而是完全在本地运行的原生智能体。不用联网数据压根不上传全天候主动感知、跟你交互、自主控车、多模态问答全都在你自己的车里悄无声息地完成。如果说上面两块是负责“思考”那真正管“行动”的就是马赫VLA。发布会上放的那些视频说实话看得我手心微微冒汗挖掘机的巨大爪臂突然伸出来车子能自己从容减速等着爪臂一收它马上提速通过路口左转对向突然来车它唰的一下切进倒挡让开然后再切回来继续走还有穿着黄马甲的保安在工地前用手势比划车子居然能看懂“停”和“行”的手势……这种在老司机眼里都算高难度的操作它不是靠程序写死的是真学会了。这背后靠的是什么双马赫M100芯片给了2560TOPS的算力模仿学习的数据量多了50%强化学习数据量直接暴增15倍行泊一体的模型参数量大了10倍TPS加码了15倍。而且理想把架构彻底翻新了用一个原生多模态MoE大模型取代了过去感知、预测、规划各管各的模块拼盘。让“看见、理解、思考、行动”从一开始就在同一个框架里长在一起而不是先看见再琢磨再执行。视觉上也有个王炸叫全新的3D ViT视觉架构。这东西的特别之处在于它不止能看懂环境的3D结构还能看懂物体的属性、纹理、类型——因为它保留了完整的RGB信息没有一丁点损耗。更厉害的是它能做动静分离在3D环境中精确判断目标是动还是静。詹锟打了一个特别妙的比方你遮住一只眼因为从小习惯了双眼训练大脑已经把那种能力固化下来了单眼也能看出立体感。3D ViT就是同一套思路用高维三维空间数据去训练让一个单目摄像头也能构建出完整的三维世界。现场有个环节理想直接调用了车载系统的实时视角大屏幕上瞬间就重建出了整个发布会的三维场景底下坐着的人的姿态、位置甚至场地后排墙上的文字全被精准识别出来。那一刻我真切感觉到这辆车开始“看见”了。理想在赶超特斯拉这件事上说得也很实诚。詹锟承认国内第一梯队之间差距可能变小了但大家跟特斯拉的距离并没有缩小特斯拉还是很强。追赶分两层第一层是基础体验安全感、效率、舒适度能不能跟FSD拉到同一水平线第二层是独有能力比如特斯拉会礼让特殊车辆有极窄通行的变态精准度还能识别交警手势指挥。但他同时也说随着芯片性能进一步释放纯视觉的帧率往15Hz、20Hz甚至更高走加上3D ViT带来的更完整视觉表征2026年年底追上FSD V14“是有机会的”。不过更让我触动的是他说的护城河理论。詹锟的原话是只有芯片、基础设施、模型全栈可控迁移成本才足够高。你如果只做算法中美之间人才流动那么快很容易就被带走了。但如果你是全栈的迁移代价极高而且很难。他还补了一句很多人容易忽略的得下苦功夫比如精细地洗数据这些活儿不高大上但却是真正的护城河。说到全栈就一定得提那颗“心脏”——芯片。CTO谢炎拿出马赫M100的时候给它的定义是“全球首款动态数据流AI芯片”。这背后有个特别有意思的故事四年前立项的时候理想就给这颗芯片定了一个几乎不讲理的目标——必须做到外购芯片的4倍性能否则自研根本没意义同时还得帮公司省钱。团队花了半年做分析得出一个清醒得吓人的结论要想超过英伟达照着英伟达的路子走根本行不通。人家起步早了几十年资源是你的几个数量级你在同一条跑道上跟博尔特赛跑人家还比你早跑两秒你凭什么超唯一的机会是跑另一条路。这条路就是数据流架构。传统的冯·诺依曼架构统治了七十年它把计算抽象成一条顺序执行的指令队列为了维持这玩意儿芯片得堆天量的晶体管去做缓存、调度、分支预测AI时代一上来这些管理开销会跟着爆炸式增长。而AI的计算天生就是并行的数据是张量关系是确定的数据流动路径一清二楚它是一张数据依赖图不是一条指令队列。马赫M100的设计核心就是拆掉那个中央式的指令队列和一堆管理开销让数据的流动来驱动计算数据流到哪儿计算就在哪儿触发。架构本身就是为AI原生设计的。参数上看5纳米车规级工艺单芯片1280TOPS算力实际运行效率超过82%这在基于GPU架构的芯片上是极难达到的。更夸张的是通用性测试在马赫M100上跑通千问3.5 35B的大模型跟一台卖4万块的NVIDIA DGX Spark桌面超算比prefill速度是对方的2.7倍decode速度是1.5倍。一颗装在车里的芯片跑赢了4万块的桌面超算。谢炎在台上说了一句野心勃勃的话冯·诺依曼架构用70年推动了通用计算的辉煌今天我们从马赫M100起步希望用数据流架构接过这一棒再推AI计算辉煌70年。当越来越多车企宣布自研芯片时谢炎私下里跟我说了他的评判标准一是全量的车能不能真正用上能不能快速上车能不能跑最新一代模型并且部署到所有车上二是能不能持续迭代做一代不算什么你得有第二代、第三代。模型、芯片都有了那具身智能时代的车到底该长什么样理想给出了一个新公式具身智能汽车电动车职业司机 AI计算机生活助手。这个公式在发布会上那个Agent现场演示里被表现得淋漓尽致。最让我头皮发麻的一个场景是“李想要去接家人”。产品经理对着车一口气说了一段复杂到变态的指令“老婆在蓝色港湾购物老大在赵全营学美术老二在望京学芭蕾老三在中关村学乐高老四在马泉营打羽毛球。先接老大再接老四再接老三最后接上老二去接老婆晚上要给老四在三里屯过生日。” 五个人的位置六个不同地点一个完全打乱的接送顺序我光听着脑子就宕机了。可系统几秒钟就把答案抛出来所有地址、所有顺序一个没错。这真不是提前写好的脚本是真正运行在模型上的Agent。最后的OTA规划也摆出来了7月要把智驾效率整体提升30%会上线出行导游相关的Agent技能9月车子学会窄路会车、倒车让行Agent能连接你的手机和电脑还会多一个超级CarPlay12月Livis的反应速度要达到0.2秒比人类快56%……看到这儿我总算明白了开头那个问题具身智能跟造车到底有什么关系如果你只是想造一辆跑得更快、坐得更舒服的车那确实用不着具身智能。但如果你想造一个能保护你安全还能独立替你完成任务的伙伴你必须从架构的底层把一切都重新来过。马赫M100是心脏3D ViT是眼睛自研马赫VLA是大脑全线控底盘是手脚自研星环OS是神经系统……它们不是一个个独立卖给你的零件是同一个生命体上长在一起的器官。李想在发布会结尾说的话后来我一直记得过去10年我们创造了一个移动的家在第二个10年我们会给车和家赋予生命。理想不是在造一辆更好的车它是在试着创造一个全新的物种定义下一个时代的范式。

云克隆液相悬浮芯片新品上线！肿瘤血管新生10因子高通量检测

导语实体瘤增殖、侵袭、转移高度依赖异常血管新生，血管生成、内皮损伤、基质降解、炎症因子形成复杂交叉调控网络，单一 VEGFA 检测无法完整评估肿瘤血管微环境特征，严重干扰抗血管生成靶向药药效评价。武汉云克隆科技股份有限公司基于成熟Lum…

2026/6/29 19:33:24 阅读更多

Redis基础命令速查（适合小白）

目录一、安装与启动安装（已安装可跳过） 启动 / 停止二、客户端连接三、基础命令（最常用） 键值对操作四、常用数据类型 1. String（字符串） 2. List（列表） 3. Set&#…

2026/6/29 19:31:32 阅读更多

[UUCTF 2022 新生赛]ezrce

基础知识：针对 RCE 命令执行不回显情况可以采用： ①. DNSlog 外带回显 ② 将命令执行结果写入文件，访问文件，若文件存在则命令被执行Linux 系统命令 pwd > y：将 pwd 执行结果写入或者覆盖 y 文件内容。（…

2026/6/29 19:31:11 阅读更多

终极Windows防休眠解决方案：如何让电脑在关键时刻保持清醒

终极Windows防休眠解决方案：如何让电脑在关键时刻保持清醒【免费下载链接】NoSleep Lightweight Windows utility to prevent screen locking 项目地址: https://gitcode.com/gh_mirrors/nos/NoSleep 你是否曾经因为Windows自动休眠而中断重要工作&#xff…

2026/6/29 20:52:54 阅读更多

国内外网站建设选择-主流网站建设工具客观对比（2026年6月最新）含零代码、AI编程、源码定制交付

一、先看总表品牌 / 组合建站方式更适合谁核心优势价格BBWEYYAISAAS覆盖5000行业包括零售、工厂、外贸、本地生活价格透明、商城能力全、AI 能力强、售后重700元-3000元/年，买3送3年，年均降至350-1500元/年比文云管家式定制建站服务，支持源码…

2026/6/29 20:52:10 阅读更多

如何在10分钟内解决离线音乐库的歌词同步难题？LRCGET批量歌词下载终极指南

如何在10分钟内解决离线音乐库的歌词同步难题？LRCGET批量歌词下载终极指南【免费下载链接】lrcget Utility for mass-downloading LRC synced lyrics for your offline music library. 项目地址: https://gitcode.com/gh_mirrors/lr/lrcget 你是否曾经面对数…

2026/6/29 20:51:28 阅读更多

Unlock Music：浏览器端音乐解锁完全指南 - 3分钟学会解密各大平台加密音乐

Unlock Music：浏览器端音乐解锁完全指南 - 3分钟学会解密各大平台加密音乐【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/we…

2026/6/29 20:49:41 阅读更多

[Begin]AI Learn Data Day 0

AI 对话的原理AI 工作流平台（如 Dify）Skill（技能调用）MCP（模型上下文协议）RAG（检索增强生成）AI 进阶工作流（如 LangGraph）更多的我就没学了核心模块核心作用 …

2026/6/29 20:49:19 阅读更多

大厂Java面试场景还原：JVM原理、Spring Cloud微服务与AI RAG落地全链路问答

大厂Java面试场景还原：JVM原理、Spring Cloud微服务与AI RAG落地全链路问答第一幕：Java基础与JVM原理场景：互联网大厂电商平台，内容社区系统研发面试 **面试官：**谢飞机同学，先聊聊基础。你最近开发用Ja…

2026/6/29 20:49:19 阅读更多

Java开发者转型安全开发：从代码审计到自动化工具实践

1. 转型背景与核心驱动力最近几年，身边不少做Java后端开发的朋友，都开始或多或少地关注起安全开发这个方向。我自己也是从写了七八年Java业务代码，一步步转向了安全领域，现在主要做代码审计和自动化安全工具开发。这个转变不是一时…

2026/6/29 0:00:05 阅读更多

【TEE从入门到精通及实战】75 TEE内Wasm沙箱的内存安全：从“段错误”到“编译时保证”

75 TEE内Wasm沙箱的内存安全：从“段错误”到“编译时保证” 开篇故事去年夏天，我正帮一家金融科技公司优化他们的TEE内Wasm沙箱。他们的核心业务是在Intel SGX enclave里运行用户提交的Wasm合约，用于实时交易验证。一天下午，运维突然报警：生产环境的enclave进程频繁崩…

2026/6/29 0:00:05 阅读更多

YAML函数动态解析：打造智能接口自动化测试用例

1. 项目概述：为什么YAML测试用例需要函数动态解析？在接口自动化测试的实践中，我们常常会面临一个核心矛盾：测试用例的可维护性与灵活性。早期的测试脚本，无论是用Python的unittest还是pytest，往往将测试数据…

2026/6/29 0:00:05 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/29 0:00:05 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/6/29 1:23:10 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/29 1:23:10 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/29 13:06:32 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/29 13:32:14 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/29 13:32:14 阅读更多

相关文章

云克隆液相悬浮芯片新品上线！肿瘤血管新生10因子高通量检测

Redis基础命令速查（适合小白）

[UUCTF 2022 新生赛]ezrce

终极Windows防休眠解决方案：如何让电脑在关键时刻保持清醒

国内外网站建设选择-主流网站建设工具客观对比（2026年6月最新）含零代码、AI编程、源码定制交付

如何在10分钟内解决离线音乐库的歌词同步难题？LRCGET批量歌词下载终极指南

Unlock Music：浏览器端音乐解锁完全指南 - 3分钟学会解密各大平台加密音乐

[Begin]AI Learn Data Day 0

大厂Java面试场景还原：JVM原理、Spring Cloud微服务与AI RAG落地全链路问答

Java开发者转型安全开发：从代码审计到自动化工具实践

【TEE从入门到精通及实战】75 TEE内Wasm沙箱的内存安全：从“段错误”到“编译时保证”

YAML函数动态解析：打造智能接口自动化测试用例

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因