语言脑机接口解码流程对比【脑机接口恢复语言2】

发布时间：2026/5/28 3:54:44

上期视频大家过了一遍语言脑机接口的发展历史这期就来对比一下各篇文章的解码流程。切分单词或汉字首先我们让患者看着屏幕要求他/她朗读、默读或想象屏幕上的汉字同时记录侵入式的脑信号这篇论文里用的是 ECoG 电极。这时我们记录到的只是原始数据原始数据中包含很多噪声和毛刺这些是无用信息。懿轩注其实若计算资源丰富也可以试试能否从这些毛刺中挖掘出一些有用信息第1步我们要经过希尔伯特变换提取出原始曲线的包络从而去除这些噪声和毛刺。如图所示灰色的曲线是原始数据彩色的7条线是包络对应的是7个频段如果忘了频段可以回我上期的视频看一下。第1步后我们得到的数据是连续的一段比如说这是患者在说我很欣赏烟台这个城市时的脑信号。第2步我们要检测出患者说每个汉字的时刻把这一整句切成多个汉字比如图中的这条红线就是句子里的我。第3步我们训练一个深度学习解码器把刚才我的脑信号解码成我的音节也就是 wo。第4步我们接入一个语言模型得到汉字我。刚才我讲的4步是目前所有汉语语言脑机文章用的方法。只不过有的文章会在 ERP2Sylb 这步中加上解码声母、韵母、音调的中间步骤。这方面的工作有上海科技大学的李远宁、西湖大学的 Mohamad Sawan、浙江大学的杨洋、北京师范大学的柳昀哲、深圳河套学院的蔡思祺已经至少有5篇文章。汉语的这些解法是从英语研究学过来的。英语在2020年、2021年的文章也是一样的套路第1步做预处理第2步切成单词第3步解单词第4步把单词合成句子。但是2023年及之后英语还有一种做法——用【CTC Loss】——可以跳过切单词、解单词这两步。不切分单词或汉字CTC 全称是Connectionist Temporal Classification是2006年在语音识别中被提出的一种方法。当时统计机器学习方法例如隐马尔可夫链是语音识别领域的王者发明者Alex Graves把 Connectionist 直接加入名字中这样大家一眼就能看出来这方法在用循环神经网络。CTC的具体实现是——语音信号经分帧帧长 25ms帧移 10ms这俩数是古圣先贤帮你调好的后输入循环神经网络通过引入 blank 符号和动态规划算法绕过帧与标签的对齐从而解码出音素序列再经过语言模型得到英语句子。把第一步的语音信号换成神经信号就可以拿到语言脑机接口领域用了。懿轩注Alex Graves是Jurgen的博士生Hinton的博后LSTM就是他复兴的。看来那时候Jurgen和Hinton关系还不错今年3月末Neuralink发布了想象语音的视频。它的解码就是典型的【CTC Loss】因为它两个标签之间的空白可长可短。懿轩注我可以99%确定它用的就是【CTC Loss】但是因为它没有发论文或者技术报告所以还有一些不确定性。刚才我讲的两条英文解码路径已经概括了我上一篇视频讲的所有关于长期植入的文章。未来汉语语言脑机选择切分还是不切分中文脑机里【CTC Loss】未必就一定强于【切单字、解单字】原因如下中文1-3个音素就组成一个汉字英语四五个音素才组成一个单词。因此英语单词可以对英语音素进行一轮纠错而汉语单字不能。中文常用音节才四百个英语单词却有一万个。因此英语用切单词是注定做不到常用语的而汉语可以。当然中文上【CTC Loss】相比于【切单字、解单字】也有好处最大的好处是——未来真正给中风或渐冻症患者做的时候患者说每个汉字的发音时长肯定会有差别。若还采用【切单字、解单字】虽然我们可以通过线性变换进行拉伸或者压缩但肯定会降低解码准确率。综上两条路径都是值得尝试的。【CTC Loss】不一定非要以音素作为标签。实际上在CTC统治语音识别的十年里英文语音识别SOTA中CTC的标签经历了从音素到字符再到BPE的变化。中文语音识别SOTA中一直在使用汉字作为标签。那么中文语言脑机能用汉字作为【CTC Loss】的标签吗——一个难点是数据太少。语音识别领域里数据足够多动辄可以产生几百万汉字的数据。但是语言脑机由于患者很疲惫每周只能采集大约两万字的数据。并且长期植入时信号每周需要重新校准。因此恐怕难以产生类似语音识别那样的数据量。两万个汉字若均摊到3500常用字上每个汉字才出现5-6次解码难度可想而知。语言模型纠错无论切分还是不切分都需要用语言模型纠错。很容易想到我们可以用多个从小到大的大语言模型进行多轮纠错从而平衡解码准确率和解码速度。上图是已经发表文章中采用的大语言模型。从模型大小上你大概就能猜出来作者们是如何使用的了。未来汉语语言脑机有可能略过大语言模型纠错吗——在直接用汉字作为CTC标签前不太可能。参考文献Card, Nicholas S., Maitreyee Wairagkar, Carrina Iacobacci, et al. ‘An Accurate and Rapidly Calibrating Speech Neuroprosthesis’.New England Journal of Medicine391, no. 7 (2024): 609–18. https://doi.org/10.1056/NEJMoa2314132.Feghhi, Ebrahim, Junlin Hu, Nima Hadidi, and Jonathan C. Kao. ‘LightBeam: An Accurate and Memory-Efficient CTC Decoder for Speech Neuroprostheses’. arXiv:2603.14002. Preprint, arXiv, 14 March 2026. https://doi.org/10.48550/arXiv.2603.14002.Feng, Chen, Lu Cao, Di Wu, et al. ‘Acoustic Inspired Brain-to-Sentence Decoder for Logosyllabic Language’.Cyborg and Bionic Systems6 (January 2025): 257. https://doi.org/10.34133/cbsystems.0257.Liu, Yan, Zehao Zhao, Minpeng Xu, et al. ‘Decoding and Synthesizing Tonal Language Speech from Brain Activity’.Science Advances9, no. 23 (2023): eadh0478. https://doi.org/10.1126/sciadv.adh0478.Makin, Joseph G., David A. Moses, and Edward F. Chang. ‘Machine Translation of Cortical Activity to Text with an Encoder–Decoder Framework’.Nature Neuroscience23, no. 4 (2020): 575–82. https://doi.org/10.1038/s41593-020-0608-8.Metzger, Sean L., Kaylo T. Littlejohn, Alexander B. Silva, et al. ‘A High-Performance Neuroprosthesis for Speech Decoding and Avatar Control’.Nature620, no. 7976 (2023): 1037–46. https://doi.org/10.1038/s41586-023-06443-4.Moses, David A., Sean L. Metzger, Jessie R. Liu, et al. ‘Neuroprosthesis for Decoding Speech in a Paralyzed Person with Anarthria’.New England Journal of Medicine385, no. 3 (2021): 217–27. https://doi.org/10.1056/NEJMoa2027540.Real-Time Decoding of Full Spectrum Chinese Using Brain-Computer Interface. 2025.Silva, Alexander B., Jessie R. Liu, Sean L. Metzger, et al. ‘A Bilingual Speech Neuroprosthesis Driven by Cortical Articulatory Representations Shared between Languages’.Nature Biomedical Engineering8, no. 8 (2024): 977–91. https://doi.org/10.1038/s41551-024-01207-5.Willett, Francis R., Erin M. Kunz, Chaofei Fan, et al. ‘A High-Performance Speech Neuroprosthesis’.Nature620, no. 7976 (2023): 1031–36. https://doi.org/10.1038/s41586-023-06377-x.Yuan, Zhizhang, Yang Yang, Gaorui Zhang, et al. ‘Towards Unified Brain-to-Text Decoding across Speech Production and Perception’. arXiv:2603.12628. Preprint, arXiv, 13 March 2026. https://doi.org/10.48550/arXiv.2603.12628.Zhang, Daohan, Zhenjie Wang, Youkun Qian, et al. ‘A Brain-to-Text Framework for Decoding Natural Tonal Sentences’.Cell Reports43, no. 11 (2024): 114924. https://doi.org/10.1016/j.celrep.2024.114924.Zhang, Yizi, Linyang He, Chaofei Fan, et al. ‘Decoding Inner Speech with an End-to-End Brain-to-Text Neural Interface’. arXiv:2511.21740. Preprint, arXiv, 5 December 2025. https://doi.org/10.48550/arXiv.2511.21740.

ChatGPT饮食建议生成器上线倒计时：最后48小时必须完成的3项合规改造（GDPR+《互联网诊疗监管办法》双达标清单）

更多请点击： https://codechina.net 第一章：ChatGPT饮食建议生成器上线倒计时：最后48小时必须完成的3项合规改造（GDPR《互联网诊疗监管办法》双达标清单） 距离ChatGPT饮食建议生成器正式上线仅剩48小时，系…

2026/5/28 3:54:23 阅读更多

OpenClaw用户如何配置Taotoken作为其AI供应商并快速开始

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度 OpenClaw用户如何配置Taotoken作为其AI供应商并快速开始对于使用OpenClaw这类智能体开发工具的开发者而言，接入一个稳…

2026/5/28 3:53:23 阅读更多

从‘打包’到‘解压’：一次搞懂tar命令的-cvf、-xvf、-cvzf、-zxvf在CentOS/Ubuntu下的实战

从‘打包’到‘解压’：一次搞懂tar命令的-cvf、-xvf、-cvzf、-zxvf在CentOS/Ubuntu下的实战在Linux系统管理中，文件打包与压缩是每位开发者必须掌握的生存技能。想象这样的场景：你需要将一个包含数百个源码文件的工程目录传输给远程同事&…

2026/5/28 3:53:23 阅读更多

机器人视觉-触觉融合技术实现精细操作突破

1. 视觉-触觉融合在机器人精细操作中的核心价值在机器人操作领域，实现人类水平的精细操作能力一直是研究难点。传统方法主要依赖视觉信息，但在物体被遮挡、透明材质处理或需要力控的场景中表现受限。我们开发的这套系统通过融合高分辨率视觉信号与分布式…

2026/5/28 5:57:12 阅读更多

UniApp地图实战：手把手教你搞定用户位置授权、跳转导航与距离计算（附完整Demo）

UniApp地图功能实战：从权限管理到导航跳转的全链路解决方案在移动应用开发中，地图功能几乎是本地服务类应用的标配需求。无论是外卖配送、门店导航还是社交约会，精准的位置服务都能极大提升用户体验。UniApp作为跨平台开发框架，其…

2026/5/28 5:57:12 阅读更多

阿波罗11号代码考古：从历史源码看嵌入式系统的并发隐患与设计权衡

1. 项目概述：一次对历史代码的“考古”与“捉虫”最近，我和几位对计算机历史和航天工程同样着迷的朋友，一起干了一件挺有意思的事儿：我们“挖”出了阿波罗11号制导计算机（Apollo 11 Guidance Computer, AGC&#xff09…

2026/5/28 5:56:11 阅读更多

开发者如何运用设计思维与创新方法解决技术难题

1. 项目概述：当开发者遇见创新与设计思维“Creative Intelligence Suite”这个标题，乍一听可能有点宏大，甚至会让习惯了敲代码、看文档的开发者感到一丝陌生。我们通常认为，创造力是设计师、艺术家或产品经理的领域，而…

2026/5/28 5:56:11 阅读更多

FDPS框架GPU加速：间接寻址与列表重用算法突破粒子模拟性能瓶颈

1. 项目概述：粒子模拟的加速挑战与FDPS的应对在计算科学领域，无论是模拟宇宙中数十亿颗恒星的引力舞蹈，还是追踪流体中无数分子的碰撞轨迹，粒子模拟都是我们理解复杂物理系统的核心工具。这类模拟的本质，是计算海量粒子…

2026/5/28 5:55:11 阅读更多

网络的分类（按规模）：从你身边到全世界的网络大冒险

写在最前面：欢迎回来！ 嘿，小朋友，又见面啦！ 上次我们一起认识了计算机网络，知道了它是"让电脑互相联系"的大系统！ 但是你知道吗？ 网络其实有很多种大小！ 有的网…

2026/5/28 5:54:10 阅读更多

大模型核心加速器：KV Cache 如何将 O(n²) 计算复杂度降至 O(n)？

KV Cache 是大模型自回归生成任务的关键优化技术，通过“空间换时间”策略缓存历史 Key 和 Value 向量，将推理复杂度从 O(n) 降至 O(n)。文章阐述了语义缓存与前缀精确匹配两种核心范式，深入分析了 KV Cache 的技术底层原理、工程化应用及规模…

2026/5/28 0:00:48 阅读更多

物流系统如何打通信息孤岛？哲盟软件系统：一键打通内外部数据壁垒

在数字化转型加速的今天，物流企业面临的最大痛点之一就是信息孤岛——ERP、电商平台、智能硬件、OMS/TMS/WMS等系统各自为政，数据无法自由流转，导致人工操作繁琐、效率低下、出错率高。特别是在跨境物流领域，亚马逊、Shopee、TikT…

2026/5/28 0:02:48 阅读更多

Windows Defender终极恢复指南：5种强力方法解决禁用问题

Windows Defender终极恢复指南：5种强力方法解决禁用问题【免费下载链接】no-defender A slightly more fun way to disable windows defender firewall. (through the WSC api) 项目地址: https://gitcode.com/GitHub_Trending/no/no-defender 当你的Windo…

2026/5/28 0:04:54 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/28 4:33:02 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/28 3:32:24 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/28 3:32:25 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/27 20:16:23 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/27 15:51:09 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/27 12:55:08 阅读更多

相关文章