面壁智能开源低比特大模型训练成果 BitCPM-CANN，推理阶段释放约 6 倍显存红利

发布时间：2026/5/26 18:48:35

【导语面壁智能联合清华大学、OpenBMB 开源社区在清华大学鲲鹏昇腾科教创新卓越中心支持下正式发布并开源低比特大模型训练方向的最新成果 BitCPM-CANN该成果在华为昇腾上原生完成性能表现优异。】BitCPM-CANN低比特大模型训练新突破面壁智能宣布联合多方正式发布并开源低比特大模型训练方向的最新成果 BitCPM-CANN。从量化算子、训练算法到全链路框架BitCPM-CANN 均在华为昇腾上原生完成包含 0.5B、1B、3B、8B 四个模型尺寸。显存红利与能力保留率双优相比传统 BF16 精度BitCPM-CANN 在推理阶段释放约6 倍显存红利同时将模型能力保留率维持在 90%-97.2%。评测结果显示三个尺寸模型的能力保留率达到 95.7% - 97.2% 区间即使是能力保留最弱的 0.5B保留率也达到了 90.1%。这一成果对于手机产业意义重大6 倍的显存红利意味着一个 8B 参数的 BitCPM-CANN 大模型可以轻松运行在当前主流旗舰手机之上。搭建低比特训练底座面壁智能基于 MindSpeed × Megatron-LM 主干搭建了完整的低比特训练底座包含环境适配、32K 长序列支持、并行策略、融合算子等完整工程体系。从此所有面向昇腾的低比特训练工作都可建立在同一套公共基础设施之上。编辑观点BitCPM-CANN 的发布与开源是低比特大模型训练领域的重要突破其显存红利和高能力保留率为大模型在更多设备上的应用提供了可能搭建的训练底座也将推动相关领域的发展。

AI工具协同失效诊断手册：用3个指标（响应熵值、上下文衰减率、意图偏移度）秒判工作流亚健康

更多请点击： https://kaifayun.com 第一章：AI工具协同失效诊断手册：用3个指标（响应熵值、上下文衰减率、意图偏移度）秒判工作流亚健康当多个AI工具串联构成自动化工作流（如LLM调用API→解析结果→写入数据…

2026/5/26 18:48:35 阅读更多

终于搞懂 XSS 为什么能盗号了：Cookie、Session、HttpOnly 一次讲明白

刚开始学习 XSS 的时候，我一直有个疑问：为什么很多人都说：“XSS 能盗号”？不就是弹个：<script>alert(1)</script>吗？后来继续学习 Cookie 和 Session 之后，我才慢慢明白&#xff1a…

2026/5/26 18:48:35 阅读更多

仿生双传感纤维：一根棉线实现温度与应变独立测量

1. 项目概述：一根纤维，两种感知在柔性电子和智能材料领域，我们常常面临一个经典的工程难题：如何在一个微小、灵活且易于集成的单元内，同时、独立地监测多个物理量？比如，在一个智能织物关节处&am…

2026/5/26 18:45:51 阅读更多

华硕笔记本性能优化终极指南：告别卡顿发热，提升游戏体验

华硕笔记本性能优化终极指南：告别卡顿发热，提升游戏体验【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook…

2026/5/26 19:39:51 阅读更多

利用taotoken为ubuntu上的claude code提供稳定可靠的api后备支持

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度利用 Taotoken 为 Ubuntu 上的 Claude Code 提供稳定可靠的 API 后备支持对于在 Ubuntu 系统上使用 Claude Code 进行开发的工程师…

2026/5/26 19:38:50 阅读更多

毫米波信号透墙技术：天线嵌入式墙体解析模型与工程实践

1. 项目概述：从“穿墙难”到“信号透”的工程挑战在无线通信领域，尤其是面向未来的5G-Advanced和6G网络，一个长期困扰工程师的难题是：如何让高频信号，特别是毫米波信号，有效地穿透现代建筑墙体，…

2026/5/26 19:37:49 阅读更多

桌面全能N合一工具一个软件搞定时钟日历天气记事屏保任务栏全场景

芝麻时钟：Windows 桌面全能 N 合一工具，一个软件搞定时间、日历、天气、记事、屏保全场景还在为桌面装一堆时钟、日历、天气、记事、屏保软件而烦恼？窗口杂乱、内存占用高、切换繁琐，严重影响效率与桌面整洁度。芝麻时钟彻底解决这…

2026/5/26 19:37:49 阅读更多

PVC上压环加工非标件定制| PVC环件加工的变形控制

从图纸看，这是一个大直径薄壁环形件，外径 Φ347 mm，内径 Φ301 mm，环宽约 23 mm，截面高度约 7.2 mm（含台阶）。外圆周均布 12 个扇贝形凸耳，每个凸耳上有安装孔：正面 12Φ…

2026/5/26 19:37:49 阅读更多

2026，据说卖数据比卖机器人先赚钱

2026年初春，一场无声的财富转移正在AI产业链上悄然发生。一边是人形机器人赛道烈火烹油——2026年以来国内机器人领域融资已达391起，十余家头部企业完成股改或排队IPO，资本汹涌而入。另一边，机器人的规模化落地却迟迟没有到来——…

2026/5/26 19:37:49 阅读更多

Claude Code Skill动态发现机制全解析：为什么你的AI会自动执行代码

文章目录前言一、那个让我怀疑AI成精的自动commit事件二、静态注入：Claude偷偷给模型塞的小纸条三、Skill工具：模型自己给自己发指令的自导自演四、动态注入：Skill集合变了怎么办？五、语义匹配注入：当Skill多到烧不起t…

2026/5/26 0:00:17 阅读更多

ssm高校普法系统（10101）

有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码SQL脚本）配套文档（LWPPT开题报告/任务书）远程调试控屏包运行一键启动项目&…

2026/5/26 0:01:18 阅读更多

强化学习策略参数调节方法及值迭代算法实现 CS188 Proj3 学习笔记

强烈推荐的更好的阅读体验 Q1.Value Iteration 第一个问题是最基础的值迭代实现，这个问题没有什么难度，主要就是一边看着公式一遍敲代码复现。可以先回顾一下Note8中的Value Iteration框架.唯一唯一需要注意的就是需要使用的是batch版本，而…

2026/5/26 0:01:39 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/26 2:55:24 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/26 2:55:26 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/26 1:30:55 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/25 15:34:05 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/26 15:11:34 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/26 11:18:30 阅读更多

相关文章

AI工具协同失效诊断手册：用3个指标（响应熵值、上下文衰减率、意图偏移度）秒判工作流亚健康

终于搞懂 XSS 为什么能盗号了：Cookie、Session、HttpOnly 一次讲明白

仿生双传感纤维：一根棉线实现温度与应变独立测量

华硕笔记本性能优化终极指南：告别卡顿发热，提升游戏体验

利用taotoken为ubuntu上的claude code提供稳定可靠的api后备支持

毫米波信号透墙技术：天线嵌入式墙体解析模型与工程实践

桌面全能N合一工具 一个软件搞定时钟 日历 天气 记事 屏保 任务栏全场景

PVC上压环加工非标件定制| PVC环件加工的变形控制

2026，据说卖数据比卖机器人先赚钱

Claude Code Skill动态发现机制全解析：为什么你的AI会自动执行代码

ssm高校普法系统（10101）

强化学习策略参数调节方法及值迭代算法实现 CS188 Proj3 学习笔记

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

附录 B：术语表

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

桌面全能N合一工具一个软件搞定时钟日历天气记事屏保任务栏全场景