何恺明从高考状元到AI传奇他的ResNet改写了人工智能史“这显示了全球范围内都存在着杰出的科学家并且创新的灵感可以源自世界的任何一个角落。”——杨立昆Yann LeCun深度学习三巨头之一如此评价何恺明和ResNet的成就。前言在人工智能的编年史上有些名字注定被铭记。何恺明就是这样一个名字。2025年Nature杂志公布21世纪以来引用次数最多的25篇论文排名第一的不是诺贝尔奖得主的科学发现不是基因编辑的革命性突破而是一篇关于图像识别的AI论文——《Deep Residual Learning for Image Recognition》。这篇论文的第一作者正是何恺明。截至2025年何恺明的Google Scholar总引用量已超过71万次其中ResNet单篇论文被引超过28万次是计算机视觉乃至整个深度学习领域被引用次数最多的论文。从2009年成为CVPR最佳论文首位华人得主到2016年ResNet横扫ImageNet竞赛再到2023年获得未来科学大奖、2025年当选美国国家人工智能科学院院士——何恺明用20年时间完成了从清华物理系本科生到MIT终身教授、谷歌DeepMind杰出科学家的华丽转身。本文将从何恺明的学术起点出发深度解析这位AI传奇的成长轨迹、核心贡献与深远影响。第一章少年天才——从高考状元到清华物理系1984年何恺明出生于广东广州。从小在广州长大的他在广州市执信中学就读期间就展现出过人的天赋——获得全国物理竞赛一等奖、广东省化学竞赛一等奖。2003年5月凭借全国物理竞赛一等奖何恺明被保送至清华大学机械工程及自动化专业。但这位少年并没有安于现状——他选择继续参加高考最终以标准分900分的成绩成为当年广东省9位满分状元之一。进入清华大学后何恺明做出了一个改变人生轨迹的决定放弃原本保送的专业转而选择基础科学班。这个被誉为清华“最牛班级”的试验班旨在培养基础科学领域的拔尖人才。在清华的四年里何恺明连续三年获得清华奖学金打下了扎实的数学和物理基础。这些看似与计算机视觉无关的训练却为他日后提出ResNet的核心思想埋下了伏笔——物理学的直觉和数学的严谨让他能够穿透表象抓住问题的本质。2007年何恺明从清华物理系毕业。同年他进入香港中文大学攻读研究生师从汤晓鸥——这位后来被称为“将香港中文大学建成中国计算机视觉界黄埔军校”的学者。第二章一战成名——首位华人CVPR最佳论文得主2009年计算机视觉顶级会议CVPR在美国迈阿密举行。一篇题为《Single Image Haze Removal Using Dark Channel Prior》基于暗原色的单一图像去雾技术的论文获得了当年的CVPR最佳论文奖。这是CVPR自创办25年以来首次有华人乃至亚洲学者获得这一殊荣。论文的第一作者正是当时还是博士研究生的何恺明。这篇论文提出了一种基于“暗通道先验”的图像去雾算法能够从单张图像中有效去除雾霾的影响恢复出清晰的图像。这个想法简单而深刻——何恺明发现在大多数无雾图像中至少有一个颜色通道在某些像素点上的值非常低。利用这一统计规律就可以估算出雾的浓度并进行有效去除。这篇论文展现了何恺明研究风格的最初雏形用最简单的方法解决最本质的问题。这种“简单和本质”的原则后来贯穿了他整个学术生涯。第三章ResNet诞生——改写了深度学习的历史2015年何恺明在微软亚洲研究院工作期间带领团队提出了深度残差网络ResNet。当时深度学习领域面临一个棘手的问题随着网络层数的增加模型的性能不仅没有提升反而会下降。这就是著名的网络退化问题。许多人认为这是因为网络越深越难训练梯度消失问题无法解决。但何恺明和他的团队给出了一个出人意料的答案不是网络太深没法训练而是网络太深“学不动”了。他们的解决方案异常简洁在网络的每一层引入一个“直连通道”让输入可以直接“跳跃”到输出。这样一来网络需要学习的就不再是完整的映射而是输入与输出之间的“残差”。这个想法看似简单却蕴含着深刻的洞察与其让网络学习一个复杂的完整映射不如让它学习一个简单的“差值”。2015年底ResNet论文作为预印本发布。2016年论文正式发表并再次获得CVPR最佳论文奖。ResNet的表现惊艳了整个AI界在ImageNet图像识别大赛中ResNet-152以152层的深度击败了谷歌、英特尔、高通等业界团队斩获第一名ResNet解决了深度网络的梯度传递问题使得研究人员可以训练超过150层的神经网络比此前常用的网络层数多5倍以上在ResNet之前“深度学习”并没有那么“深”。何恺明自己曾这样总结“在ResNet之前深度学习并没有那么‘深’。”第四章ResNet的深远影响——重新定义深度学习的边界ResNet的影响力早已超越了计算机视觉的范畴。 AlphaGo AlphaFoldDeepMind的AlphaGo Zero和AlphaFold都使用了ResNet作为核心网络架构。残差连接让这些模型能够达到前所未有的深度和性能。 ChatGPT GPT系列今天的大语言模型无论是GPT系列还是BERT都普遍采用了残差结构来支撑上百层Transformer的堆叠。可以说没有ResNet就没有今天的大模型时代。 数据说话截至2025年ResNet论文在Google Scholar上的引用量已超过28万次。Nature杂志的统计分析显示这是21世纪被引用次数最多的论文。 全球认可2023年何恺明与张祥雨、任少卿、孙剑共同获得未来科学大奖数学与计算机科学奖共享100万美元奖金。这是未来科学大奖首次将数学与计算机科学奖颁给四位获奖人何恺明也成为该奖历史上最年轻的获奖者之一。2025年何恺明当选美国国家人工智能科学院院士。同年他十年前发表的另一篇论文《Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification》被授予Helmholtz Prize——这是一个被视为“十年影响力奖”的荣誉只颁给十年前的ICCV论文中被时间验证对计算机视觉领域产生“基础性、深远影响”的工作。第五章杨立昆的高度评价——“灵感可以源自世界的任何一个角落”对于何恺明和ResNet的成就深度学习三巨头之一的**杨立昆Yann LeCun**曾给予高度评价。杨立昆在采访中表示“这显示了全球范围内都存在着杰出的科学家并且创新的灵感可以源自世界的任何一个角落。”这句话分量极重。作为卷积神经网络CNN的奠基人之一杨立昆深知ResNet对于整个深度学习领域的意义。他的评价不仅是对何恺明个人能力的认可更是对全球AI研究格局的深刻洞察——顶尖的创新不再只属于硅谷。另一位AI教父**杰弗里·辛顿Geoff Hinton**也曾在不同场合表达对何恺明工作的赞赏。辛顿指出AI领域的论文在引用方面具有天然优势但ResNet的引用量能够达到如此高度证明了其在AI发展中的基石地位。第六章持续创新——从Mask R-CNN到MAEResNet之后何恺明并没有停下脚步。在Facebook AI ResearchFAIR工作期间他带领团队又推出了一系列开创性工作 Mask R-CNN2017Mask R-CNN解决了图片中的实例级对象分割问题——不仅能检测出照片中的人、动物等对象还能为每个对象实例生成高质量的分割遮罩。这项研究获得了ICCV 2017最佳论文奖马尔奖。 SimCLR2020SimCLR是一种简单有效的对比学习框架大幅提升了无监督学习的性能让模型不需要大量标注数据就能学到有用的特征表示。 MAE20212021年11月何恺明以一作身份发表论文《Masked Autoencoders Are Scalable Vision Learners》提出了一种泛化性能良好的计算机视觉识别模型。MAE将“掩码”思想引入视觉领域与同期的大语言模型预训练思路不谋而合刚刚发表就成为计算机视觉圈的热门话题。第七章学术回归与新的征程2023年何恺明做出一个重要决定从产业界回归学术界。他于2024年2月加入麻省理工学院MIT电子工程与计算机科学系担任副教授。一年后也就是2025年6月他获得MIT终身教职。这标志着何恺明完成了从“产业界明星”到“学术殿堂学者”的身份转变。在MIT他开设的课程广受学生欢迎继续培养下一代AI人才。2025年6月何恺明的最新动向再次引发关注他以“兼职杰出科学家”的身份加入谷歌DeepMind。事实上何恺明与谷歌的合作早有伏笔。2025年2月他与谷歌DeepMind全华人班底合作发表了论文《Fractal Generative Models分形生成模型》首次使逐像素生成高分辨率图像成为可能。此前他与谷歌团队还合作提出了基于连续标记的随机顺序自回归模型Fluid为自回归文生图模型的扩展指出了新方向。从微软亚洲研究院到Facebook AI Research从MIT到谷歌DeepMind——何恺明的每一次转身都牵引着整个AI界的目光。您说得完全正确这是一个重要的事实错误。我已经将第八章“科研哲学——‘简单和本质’”中的相关表述修正如下第八章科研哲学——“简单和本质”纵观何恺明的学术生涯一条清晰的脉络贯穿始终追求“简单和本质”。这一哲学源自他在微软亚洲研究院期间的导师孙剑的深刻影响。孙剑始终强调“简单和本质”的研究原则这一理念深深植根于何恺明的科研实践中并贯穿于ResNet等一系列开创性工作。何恺明的同事、同样师从孙剑的张祥雨曾在获得未来科学大奖时这样回忆导师的影响“我在微软的两位导师何恺明和孙剑给我指导很多他始终让我们坚持的一个原则是简单和本质。这也能够让我们在一堆貌似正确的路线中很幸运的找到了正确的那条路……”这种理念体现在何恺明的每一篇重要论文中暗通道去雾用一个简单的统计规律解决复杂的去雾问题ResNet用一个简洁的“残差”思想突破深度网络的训练瓶颈MAE用一个直观的“掩码”思路统一视觉与语言的预训练范式。李沐曾说过一句广为流传的话“假设你在使用卷积神经网络有一半的可能性就是在使用ResNet或它的变种。”这种影响力正是源于ResNet的简单——因为它足够简单所以易于理解、易于使用、易于扩展。何恺明的论文还有一个显著特点简明易读。即使是具有开创性的工作他也总是用最直观的方式解释自己的“简单”想法不使用trick也没有不必要的证明。第九章人物印象——AI圈的“低调大神”在AI圈何恺明有一个广为人知的形象低调、务实、纯粹。他每年只产出少量一作文章但每一篇都一定是重量级的几乎没有例外。这种“少而精”的研究风格在追求论文数量的学术界显得尤为珍贵。他很少接受媒体采访很少在社交平台发声。公众对他的了解更多来自论文作者名单上那个熟悉的名字或是学术会议上那个低调的身影。但了解他的人都知道何恺明对待研究的态度极其严谨。他会花费大量时间反复推敲一个想法的本质直到找到最简洁、最优雅的解决方案。一位与何恺明共事过的研究者曾这样评价“他是那种会把一个问题想得极其透彻才开始动手的人。一旦动手基本就是正确的方向。”尾声AI传奇仍在继续从2009年成为首位华人CVPR最佳论文得主到2015年提出改写AI历史的ResNet从2023年获得未来科学大奖到2025年成为MIT终身教授、谷歌DeepMind杰出科学家——何恺明用20年时间完成了一段AI界的传奇旅程。他的ResNet是21世纪被引用次数最多的论文他的学术总引用超过71万次他的研究工作贯穿了计算机视觉与深度学习发展的黄金时代。但对于何恺明来说这一切可能只是开始。在2025年的一次分享中他提出了一个耐人寻味的问题“生成建模有没有可能也走向端到端”这个问题或许正是他接下来要攻克的下一座山峰。正如杨立昆所言创新的灵感可以源自世界的任何一个角落。而何恺明正在用自己的方式证明——真正的创新源于对“简单和本质”的不懈追求。 写在最后何恺明的故事是一个关于天才、坚持与纯粹的故事。他是高考状元却选择了一条少有人走的路他是CVPR首位华人最佳论文得主却从未停止探索他是ResNet之父却依然在寻找AI的下一个突破口。他的经历告诉我们伟大的创新往往源于最简单、最本质的思考。而这或许就是何恺明留给AI界最宝贵的财富。
71万次引用、ResNet之父、MIT终身教授:何恺明的AI封神之路
发布时间:2026/5/21 21:12:12
何恺明从高考状元到AI传奇他的ResNet改写了人工智能史“这显示了全球范围内都存在着杰出的科学家并且创新的灵感可以源自世界的任何一个角落。”——杨立昆Yann LeCun深度学习三巨头之一如此评价何恺明和ResNet的成就。前言在人工智能的编年史上有些名字注定被铭记。何恺明就是这样一个名字。2025年Nature杂志公布21世纪以来引用次数最多的25篇论文排名第一的不是诺贝尔奖得主的科学发现不是基因编辑的革命性突破而是一篇关于图像识别的AI论文——《Deep Residual Learning for Image Recognition》。这篇论文的第一作者正是何恺明。截至2025年何恺明的Google Scholar总引用量已超过71万次其中ResNet单篇论文被引超过28万次是计算机视觉乃至整个深度学习领域被引用次数最多的论文。从2009年成为CVPR最佳论文首位华人得主到2016年ResNet横扫ImageNet竞赛再到2023年获得未来科学大奖、2025年当选美国国家人工智能科学院院士——何恺明用20年时间完成了从清华物理系本科生到MIT终身教授、谷歌DeepMind杰出科学家的华丽转身。本文将从何恺明的学术起点出发深度解析这位AI传奇的成长轨迹、核心贡献与深远影响。第一章少年天才——从高考状元到清华物理系1984年何恺明出生于广东广州。从小在广州长大的他在广州市执信中学就读期间就展现出过人的天赋——获得全国物理竞赛一等奖、广东省化学竞赛一等奖。2003年5月凭借全国物理竞赛一等奖何恺明被保送至清华大学机械工程及自动化专业。但这位少年并没有安于现状——他选择继续参加高考最终以标准分900分的成绩成为当年广东省9位满分状元之一。进入清华大学后何恺明做出了一个改变人生轨迹的决定放弃原本保送的专业转而选择基础科学班。这个被誉为清华“最牛班级”的试验班旨在培养基础科学领域的拔尖人才。在清华的四年里何恺明连续三年获得清华奖学金打下了扎实的数学和物理基础。这些看似与计算机视觉无关的训练却为他日后提出ResNet的核心思想埋下了伏笔——物理学的直觉和数学的严谨让他能够穿透表象抓住问题的本质。2007年何恺明从清华物理系毕业。同年他进入香港中文大学攻读研究生师从汤晓鸥——这位后来被称为“将香港中文大学建成中国计算机视觉界黄埔军校”的学者。第二章一战成名——首位华人CVPR最佳论文得主2009年计算机视觉顶级会议CVPR在美国迈阿密举行。一篇题为《Single Image Haze Removal Using Dark Channel Prior》基于暗原色的单一图像去雾技术的论文获得了当年的CVPR最佳论文奖。这是CVPR自创办25年以来首次有华人乃至亚洲学者获得这一殊荣。论文的第一作者正是当时还是博士研究生的何恺明。这篇论文提出了一种基于“暗通道先验”的图像去雾算法能够从单张图像中有效去除雾霾的影响恢复出清晰的图像。这个想法简单而深刻——何恺明发现在大多数无雾图像中至少有一个颜色通道在某些像素点上的值非常低。利用这一统计规律就可以估算出雾的浓度并进行有效去除。这篇论文展现了何恺明研究风格的最初雏形用最简单的方法解决最本质的问题。这种“简单和本质”的原则后来贯穿了他整个学术生涯。第三章ResNet诞生——改写了深度学习的历史2015年何恺明在微软亚洲研究院工作期间带领团队提出了深度残差网络ResNet。当时深度学习领域面临一个棘手的问题随着网络层数的增加模型的性能不仅没有提升反而会下降。这就是著名的网络退化问题。许多人认为这是因为网络越深越难训练梯度消失问题无法解决。但何恺明和他的团队给出了一个出人意料的答案不是网络太深没法训练而是网络太深“学不动”了。他们的解决方案异常简洁在网络的每一层引入一个“直连通道”让输入可以直接“跳跃”到输出。这样一来网络需要学习的就不再是完整的映射而是输入与输出之间的“残差”。这个想法看似简单却蕴含着深刻的洞察与其让网络学习一个复杂的完整映射不如让它学习一个简单的“差值”。2015年底ResNet论文作为预印本发布。2016年论文正式发表并再次获得CVPR最佳论文奖。ResNet的表现惊艳了整个AI界在ImageNet图像识别大赛中ResNet-152以152层的深度击败了谷歌、英特尔、高通等业界团队斩获第一名ResNet解决了深度网络的梯度传递问题使得研究人员可以训练超过150层的神经网络比此前常用的网络层数多5倍以上在ResNet之前“深度学习”并没有那么“深”。何恺明自己曾这样总结“在ResNet之前深度学习并没有那么‘深’。”第四章ResNet的深远影响——重新定义深度学习的边界ResNet的影响力早已超越了计算机视觉的范畴。 AlphaGo AlphaFoldDeepMind的AlphaGo Zero和AlphaFold都使用了ResNet作为核心网络架构。残差连接让这些模型能够达到前所未有的深度和性能。 ChatGPT GPT系列今天的大语言模型无论是GPT系列还是BERT都普遍采用了残差结构来支撑上百层Transformer的堆叠。可以说没有ResNet就没有今天的大模型时代。 数据说话截至2025年ResNet论文在Google Scholar上的引用量已超过28万次。Nature杂志的统计分析显示这是21世纪被引用次数最多的论文。 全球认可2023年何恺明与张祥雨、任少卿、孙剑共同获得未来科学大奖数学与计算机科学奖共享100万美元奖金。这是未来科学大奖首次将数学与计算机科学奖颁给四位获奖人何恺明也成为该奖历史上最年轻的获奖者之一。2025年何恺明当选美国国家人工智能科学院院士。同年他十年前发表的另一篇论文《Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification》被授予Helmholtz Prize——这是一个被视为“十年影响力奖”的荣誉只颁给十年前的ICCV论文中被时间验证对计算机视觉领域产生“基础性、深远影响”的工作。第五章杨立昆的高度评价——“灵感可以源自世界的任何一个角落”对于何恺明和ResNet的成就深度学习三巨头之一的**杨立昆Yann LeCun**曾给予高度评价。杨立昆在采访中表示“这显示了全球范围内都存在着杰出的科学家并且创新的灵感可以源自世界的任何一个角落。”这句话分量极重。作为卷积神经网络CNN的奠基人之一杨立昆深知ResNet对于整个深度学习领域的意义。他的评价不仅是对何恺明个人能力的认可更是对全球AI研究格局的深刻洞察——顶尖的创新不再只属于硅谷。另一位AI教父**杰弗里·辛顿Geoff Hinton**也曾在不同场合表达对何恺明工作的赞赏。辛顿指出AI领域的论文在引用方面具有天然优势但ResNet的引用量能够达到如此高度证明了其在AI发展中的基石地位。第六章持续创新——从Mask R-CNN到MAEResNet之后何恺明并没有停下脚步。在Facebook AI ResearchFAIR工作期间他带领团队又推出了一系列开创性工作 Mask R-CNN2017Mask R-CNN解决了图片中的实例级对象分割问题——不仅能检测出照片中的人、动物等对象还能为每个对象实例生成高质量的分割遮罩。这项研究获得了ICCV 2017最佳论文奖马尔奖。 SimCLR2020SimCLR是一种简单有效的对比学习框架大幅提升了无监督学习的性能让模型不需要大量标注数据就能学到有用的特征表示。 MAE20212021年11月何恺明以一作身份发表论文《Masked Autoencoders Are Scalable Vision Learners》提出了一种泛化性能良好的计算机视觉识别模型。MAE将“掩码”思想引入视觉领域与同期的大语言模型预训练思路不谋而合刚刚发表就成为计算机视觉圈的热门话题。第七章学术回归与新的征程2023年何恺明做出一个重要决定从产业界回归学术界。他于2024年2月加入麻省理工学院MIT电子工程与计算机科学系担任副教授。一年后也就是2025年6月他获得MIT终身教职。这标志着何恺明完成了从“产业界明星”到“学术殿堂学者”的身份转变。在MIT他开设的课程广受学生欢迎继续培养下一代AI人才。2025年6月何恺明的最新动向再次引发关注他以“兼职杰出科学家”的身份加入谷歌DeepMind。事实上何恺明与谷歌的合作早有伏笔。2025年2月他与谷歌DeepMind全华人班底合作发表了论文《Fractal Generative Models分形生成模型》首次使逐像素生成高分辨率图像成为可能。此前他与谷歌团队还合作提出了基于连续标记的随机顺序自回归模型Fluid为自回归文生图模型的扩展指出了新方向。从微软亚洲研究院到Facebook AI Research从MIT到谷歌DeepMind——何恺明的每一次转身都牵引着整个AI界的目光。您说得完全正确这是一个重要的事实错误。我已经将第八章“科研哲学——‘简单和本质’”中的相关表述修正如下第八章科研哲学——“简单和本质”纵观何恺明的学术生涯一条清晰的脉络贯穿始终追求“简单和本质”。这一哲学源自他在微软亚洲研究院期间的导师孙剑的深刻影响。孙剑始终强调“简单和本质”的研究原则这一理念深深植根于何恺明的科研实践中并贯穿于ResNet等一系列开创性工作。何恺明的同事、同样师从孙剑的张祥雨曾在获得未来科学大奖时这样回忆导师的影响“我在微软的两位导师何恺明和孙剑给我指导很多他始终让我们坚持的一个原则是简单和本质。这也能够让我们在一堆貌似正确的路线中很幸运的找到了正确的那条路……”这种理念体现在何恺明的每一篇重要论文中暗通道去雾用一个简单的统计规律解决复杂的去雾问题ResNet用一个简洁的“残差”思想突破深度网络的训练瓶颈MAE用一个直观的“掩码”思路统一视觉与语言的预训练范式。李沐曾说过一句广为流传的话“假设你在使用卷积神经网络有一半的可能性就是在使用ResNet或它的变种。”这种影响力正是源于ResNet的简单——因为它足够简单所以易于理解、易于使用、易于扩展。何恺明的论文还有一个显著特点简明易读。即使是具有开创性的工作他也总是用最直观的方式解释自己的“简单”想法不使用trick也没有不必要的证明。第九章人物印象——AI圈的“低调大神”在AI圈何恺明有一个广为人知的形象低调、务实、纯粹。他每年只产出少量一作文章但每一篇都一定是重量级的几乎没有例外。这种“少而精”的研究风格在追求论文数量的学术界显得尤为珍贵。他很少接受媒体采访很少在社交平台发声。公众对他的了解更多来自论文作者名单上那个熟悉的名字或是学术会议上那个低调的身影。但了解他的人都知道何恺明对待研究的态度极其严谨。他会花费大量时间反复推敲一个想法的本质直到找到最简洁、最优雅的解决方案。一位与何恺明共事过的研究者曾这样评价“他是那种会把一个问题想得极其透彻才开始动手的人。一旦动手基本就是正确的方向。”尾声AI传奇仍在继续从2009年成为首位华人CVPR最佳论文得主到2015年提出改写AI历史的ResNet从2023年获得未来科学大奖到2025年成为MIT终身教授、谷歌DeepMind杰出科学家——何恺明用20年时间完成了一段AI界的传奇旅程。他的ResNet是21世纪被引用次数最多的论文他的学术总引用超过71万次他的研究工作贯穿了计算机视觉与深度学习发展的黄金时代。但对于何恺明来说这一切可能只是开始。在2025年的一次分享中他提出了一个耐人寻味的问题“生成建模有没有可能也走向端到端”这个问题或许正是他接下来要攻克的下一座山峰。正如杨立昆所言创新的灵感可以源自世界的任何一个角落。而何恺明正在用自己的方式证明——真正的创新源于对“简单和本质”的不懈追求。 写在最后何恺明的故事是一个关于天才、坚持与纯粹的故事。他是高考状元却选择了一条少有人走的路他是CVPR首位华人最佳论文得主却从未停止探索他是ResNet之父却依然在寻找AI的下一个突破口。他的经历告诉我们伟大的创新往往源于最简单、最本质的思考。而这或许就是何恺明留给AI界最宝贵的财富。