从Frank Rosenblatt到ChatGPT：用Python手搓一个MLP，重温AI的‘Hello World’

发布时间：2026/5/31 1:55:27

从Frank Rosenblatt到ChatGPT用Python手搓一个MLP重温AI的‘Hello World’1958年的某个清晨康奈尔航空实验室的Frank Rosenblatt在示波器上观察到了第一个会学习的机器——感知机。这个由电机、电位器和光电管组成的庞然大物用今天标准来看甚至称不上是计算机却奠定了现代深度学习的基石。六十五年后当我们用几行Python代码就能构建出比当年强大百万倍的神经网络时或许该停下脚步思考从感知机到GPT-4AI究竟走过了怎样的进化之路1. 感知机数字神经元的诞生Frank Rosenblatt的感知机模型本质上是一个线性分类器其核心思想至今仍是神经网络的DNA。让我们拆解这个看似简单的结构class Perceptron: def __init__(self, input_size): self.weights np.random.rand(input_size) self.bias 0 def predict(self, inputs): summation np.dot(inputs, self.weights) self.bias return 1 if summation 0 else 0这个不足10行的Python类实现了感知机的核心逻辑。但隐藏在简单代码背后的是三个革命性设计权重机制每个输入特征对应可调节的权重模拟生物神经元的突触强度阈值激活阶跃函数实现了神经元的全有或全无放电特性迭代学习通过错误驱动调整权重形成自适应系统1969年Minsky和Papert指出的XOR问题局限反而推动了神经网络研究的第一次范式转移。他们证明单层感知机无法解决非线性可分问题这直接催生了多层网络结构的探索。提示在Jupyter Notebook中尝试用上述Perceptron类处理AND/OR逻辑运算再测试XOR案例能直观体会这一局限2. 从感知机到MLP关键突破解析多层感知机(MLP)的进化绝非简单堆叠层次而是解决了三个根本问题2.1 非线性激活函数Sigmoid、tanh和ReLU等函数的引入使网络能够拟合任意复杂函数。对比不同激活函数的特性函数类型公式优点缺点Sigmoid1/(1e^-x)输出平滑(0,1)梯度消失tanh(e^x-e^-x)/(e^xe^-x)输出(-1,1)计算量大ReLUmax(0,x)计算高效神经元死亡def relu(x): return np.maximum(0, x) def relu_derivative(x): return (x 0).astype(float)2.2 反向传播算法误差反向传播是MLP的训练引擎其数学本质是链式法则的递归应用。以下关键步骤值得关注前向计算各层激活值计算输出误差δ^L ∇_aC ⊙ σ(z^L)反向传播误差δ^l ((w^{l1})^T δ^{l1}) ⊙ σ(z^l)计算梯度∂C/∂w^l δ^l (a^{l-1})^T2.3 隐藏层设计隐藏层数量和宽度决定了网络的表达能力。实践中常见的设计模式金字塔结构逐层减少神经元数量如[784, 512, 256, 10]瓶颈结构中间层维度小于输入输出强制特征压缩残差连接跨层直连缓解梯度消失问题3. NumPy实现MLP穿越时空的代码对话让我们用纯NumPy实现一个完整MLP与Frank Rosenblatt的原始设计展开跨时空对话class MLP: def __init__(self, layer_sizes): self.weights [ np.random.randn(in_size, out_size) * np.sqrt(2./in_size) for in_size, out_size in zip(layer_sizes[:-1], layer_sizes[1:]) ] self.biases [np.zeros((1, size)) for size in layer_sizes[1:]] def forward(self, x): a x for w, b in zip(self.weights, self.biases): z np.dot(a, w) b a relu(z) return a def train(self, x, y, epochs, lr): for epoch in range(epochs): # 前向传播 activations [x] zs [] a x for w, b in zip(self.weights, self.biases): z np.dot(a, w) b zs.append(z) a relu(z) activations.append(a) # 反向传播 delta (activations[-1] - y) * relu_derivative(zs[-1]) for l in range(len(self.weights)-1, 0, -1): self.weights[l] - lr * np.dot(activations[l].T, delta) self.biases[l] - lr * np.sum(delta, axis0, keepdimsTrue) delta np.dot(delta, self.weights[l].T) * relu_derivative(zs[l-1]) self.weights[0] - lr * np.dot(activations[0].T, delta) self.biases[0] - lr * np.sum(delta, axis0, keepdimsTrue)这段代码实现了He初始化缓解梯度消失批量梯度下降ReLU激活函数完整的反向传播在MNIST数据集上测试仅用单隐藏层(128神经元)就能达到约97%准确率——这正是Frank Rosenblatt当年梦寐以求的能力。4. 从MLP到Transformer进化之路现代Transformer架构与MLP存在惊人的内在联系。比较两者的核心组件组件MLP实现Transformer变体全连接层Dense层FFN(前馈网络)激活函数ReLUGELU/Swish权重共享无跨头注意力正则化L2/DropoutLayer Norm有趣的是Transformer中的FFN模块本质上就是两个MLP的级联FFN(x) W_2 · GELU(W_1x b_1) b_2这印证了深度学习的一个深层规律基础模块的巧妙组合往往比复杂设计更重要。Frank Rosenblatt的感知机思想通过不断进化和组合最终催生了ChatGPT这样的AI系统。

深度拆解：从 Linux 内核 Namespace 与 Cgroups 洞察容器技术的底层本质

摘要在云原生（Cloud Native）技术席卷全球的今天，Docker、Kubernetes 等容器技术已经成为应用部署的标准范式。许多人将容器俗称为“轻量级虚拟机”，但从 Linux 操作系统的底层视角来看，容器并不是虚拟机，它…

2026/5/31 1:55:27 阅读更多

2026年银行分行选址的5大硬性标准，你的分行达标了吗？

2026年银行分行选址的5大硬性标准，你的分行达标了吗？选址决策是银行分行长期回报率的分水岭。在淮海经济区金融版图重塑的当下，2026年分行选址的标准已从“租个门面”升级为“嵌入产业生态”。以下五大硬性标准，是头部金融机构的共…

2026/5/31 1:55:27 阅读更多

Shapely计算IOU踩坑记：TopologyException自相交错误，一个buffer(0.01)就搞定了？

Shapely几何计算中的自相交陷阱：从TopologyException到高效修复方案深夜的显示器前，你正用Shapely计算两个多边形的交并比(IOU)，突然终端抛出鲜红的错误提示："TopologyException: Input geom 1 is invalid: Self-intersectio…

2026/5/31 1:55:27 阅读更多

告别低画质！用you-get和EditThisCookie插件搞定B站大会员视频下载（附完整cookie配置流程）

突破B站画质限制：用you-get与EditThisCookie实现大会员视频下载全攻略每次看到B站上那些精美的4K大会员专属视频，却苦于无法下载保存？或者下载下来的视频画质总是不尽如人意？作为技术爱好者，我发现了一套完整的解决方案…

2026/5/31 2:29:31 阅读更多

保姆级教程：手把手教你用CANoe模拟UDS 0x36服务进行ECU数据刷写

汽车电子工程师实战：用CANoe精准模拟UDS 0x36数据刷写全流程当ECU需要更新固件或配置参数时，UDS协议中的0x36服务（TransferData）扮演着关键角色。作为汽车电子工程师，掌握这一服务的实操技能不仅能提升诊断效率&#x…

2026/5/31 2:28:30 阅读更多

AI 聊天机器人完全入门：从零到让你的第一个机器人跑起来

写给完全零基础的新手。本文不需要你懂编程、不需要你懂网络协议，只要你会用电脑、会打字，就能跟着做。目录聊天机器人到底是什么？ 搞清楚三个角色就够了动手前需要准备什么方案一：轻量入门（NoneBot2 NapCat&…

2026/5/31 2:28:10 阅读更多

别只盯着ChatGPT了！用Python+Scikit-learn亲手实现一个‘迷你AI面试官’

用Python打造你的第一个AI面试官：从零构建智能问答评估系统当ChatGPT等大模型席卷全球时，很多人忽略了AI最本质的魅力——亲手构建一个能解决实际问题的微型智能系统。本文将带你用Python和Scikit-learn，从公开数据集开始，逐步搭建…

2026/5/31 2:27:50 阅读更多

车间做防静电地坪?别被施工队忽悠了!

作为一名在制造业混迹多年的采购老兵，我最烦的就是花冤枉钱买不到对的东西。尤其是在工厂地面这件事上，水真的太深了。你随便找个施工队，铺个普通环氧地坪，两三年就起皮、开裂；要防静电的，结果做完一测&…

2026/5/31 2:27:09 阅读更多

用Unity Tilemap复刻《超级马里奥》第一关：手把手教你搭建经典横版关卡与角色交互

用Unity Tilemap复刻《超级马里奥》第一关：从像素到交互的完整设计指南当1985年那个穿着红色工装裤的水管工第一次跳上电视屏幕时，很少有人能预料到这个小角色会成为游戏史上的里程碑。三十多年后的今天，我们依然能从《超级马里奥》第一关的设…

2026/5/31 2:27:09 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/5/31 0:02:08 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/5/31 0:02:08 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/5/31 0:03:49 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

2026/5/31 0:02:08 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

2026/5/31 0:02:08 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

2026/5/31 0:03:49 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/30 3:46:38 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/30 3:48:20 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/30 22:39:05 阅读更多

相关文章

深度拆解：从 Linux 内核 Namespace 与 Cgroups 洞察容器技术的底层本质

2026年银行分行选址的5大硬性标准，你的分行达标了吗？

Shapely计算IOU踩坑记：TopologyException自相交错误，一个buffer(0.01)就搞定了？

告别低画质！用you-get和EditThisCookie插件搞定B站大会员视频下载（附完整cookie配置流程）

保姆级教程：手把手教你用CANoe模拟UDS 0x36服务进行ECU数据刷写

AI 聊天机器人完全入门：从零到让你的第一个机器人跑起来

别只盯着ChatGPT了！用Python+Scikit-learn亲手实现一个‘迷你AI面试官’

车间做防静电地坪?别被施工队忽悠了!

用Unity Tilemap复刻《超级马里奥》第一关：手把手教你搭建经典横版关卡与角色交互

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥