随着智能手机性能不断提升一款能让AI大模型在手机本地高效运行的新技术正悄然改变着我们使用移动设备的方式。近日Meta公司发布了一项名为MobileMoE的创新研究在商用手机上成功部署了混合专家模型MoE实测在iPhone 16 Pro上输入阶段最高提速3.8倍。手机端大模型迎来新突破过去手机上的大语言模型普遍采用传统的稠密架构。这是因为移动设备在内存、算力和时延方面的限制较为严格。然而随着手机DRAM容量不断提升混合专家模型开始有了在手机上部署的可能性。MobileMoE是Meta团队首次实现的高效MoE推理方案。简单来说它像是一支分工明确的专家团队——每个token文本的基本单位通过路由器挑选出得分最高的几位专家参与计算同时保留一位共享专家始终参与工作。这种设计让模型在保持精度的同时大幅降低了计算量。性能表现令人瞩目在14项基础测试中MobileMoE在内存相近的情况下仅用稠密模型1/4到1/2的推理计算量就达到了持平甚至更高的准确率。这一结果在业界引起了广泛关注。实测数据显示在iPhone 16 Pro的GPU和MLX后端上MobileMoE-S版本的输入阶段最高提速达到3.8倍逐token生成阶段提速2.2到3.4倍。这意味着未来我们使用手机语音助手、进行文本生成等操作时响应速度将有显著提升。训练流程科学严谨这套技术方案的形成并非一蹴而就。研究团队采用了四个阶段的训练流程首先是用约6万亿个token进行预训练覆盖数学、代码、知识和科学等多个领域然后将上下文长度扩展到8192进一步提高高质量数据占比接着在超过8000万样本的指令微调数据上进行训练最后进行量化处理将关键部分量化到INT4精度。这种科学严谨的训练方法使得MobileMoE在精度与推理开销之间取得了更好平衡。与竞品对比各有优劣测试结果显示MobileMoE-M的平均分超过了Qwen3.5 2BMobileMoE-L的平均分高于OLMoE-1B-7B而所需的模型规模却更小。在代码和数学任务上MobileMoE的表现尤为突出。不过研究团队也坦诚指出在指令跟随和知识推理能力上MobileMoE仍与Qwen3.5 2B存在一定差距。这主要是后训练阶段还有优化空间。手机AI大模型未来可期此次发布的技术成果为手机端AI大模型的发展指明了方向。Meta团队表示未来在动态路由、专家剪枝、混合精度量化以及移动端NPU部署等方面还有更多优化空间。随着移动端AI技术的不断进步未来我们或许可以期待更智能的手机助手、更快的本地AI应用、更丰富的移动端AI功能——这一切正在一步步变为现实。
AI大模型装上“智能手机“,Meta新方案让手机推理效率翻倍!
发布时间:2026/6/1 22:24:37
随着智能手机性能不断提升一款能让AI大模型在手机本地高效运行的新技术正悄然改变着我们使用移动设备的方式。近日Meta公司发布了一项名为MobileMoE的创新研究在商用手机上成功部署了混合专家模型MoE实测在iPhone 16 Pro上输入阶段最高提速3.8倍。手机端大模型迎来新突破过去手机上的大语言模型普遍采用传统的稠密架构。这是因为移动设备在内存、算力和时延方面的限制较为严格。然而随着手机DRAM容量不断提升混合专家模型开始有了在手机上部署的可能性。MobileMoE是Meta团队首次实现的高效MoE推理方案。简单来说它像是一支分工明确的专家团队——每个token文本的基本单位通过路由器挑选出得分最高的几位专家参与计算同时保留一位共享专家始终参与工作。这种设计让模型在保持精度的同时大幅降低了计算量。性能表现令人瞩目在14项基础测试中MobileMoE在内存相近的情况下仅用稠密模型1/4到1/2的推理计算量就达到了持平甚至更高的准确率。这一结果在业界引起了广泛关注。实测数据显示在iPhone 16 Pro的GPU和MLX后端上MobileMoE-S版本的输入阶段最高提速达到3.8倍逐token生成阶段提速2.2到3.4倍。这意味着未来我们使用手机语音助手、进行文本生成等操作时响应速度将有显著提升。训练流程科学严谨这套技术方案的形成并非一蹴而就。研究团队采用了四个阶段的训练流程首先是用约6万亿个token进行预训练覆盖数学、代码、知识和科学等多个领域然后将上下文长度扩展到8192进一步提高高质量数据占比接着在超过8000万样本的指令微调数据上进行训练最后进行量化处理将关键部分量化到INT4精度。这种科学严谨的训练方法使得MobileMoE在精度与推理开销之间取得了更好平衡。与竞品对比各有优劣测试结果显示MobileMoE-M的平均分超过了Qwen3.5 2BMobileMoE-L的平均分高于OLMoE-1B-7B而所需的模型规模却更小。在代码和数学任务上MobileMoE的表现尤为突出。不过研究团队也坦诚指出在指令跟随和知识推理能力上MobileMoE仍与Qwen3.5 2B存在一定差距。这主要是后训练阶段还有优化空间。手机AI大模型未来可期此次发布的技术成果为手机端AI大模型的发展指明了方向。Meta团队表示未来在动态路由、专家剪枝、混合精度量化以及移动端NPU部署等方面还有更多优化空间。随着移动端AI技术的不断进步未来我们或许可以期待更智能的手机助手、更快的本地AI应用、更丰富的移动端AI功能——这一切正在一步步变为现实。