别再死记硬背了！用PyTorch动手画一画，5分钟搞懂CNN和MLP到底啥关系

发布时间：2026/6/8 10:57:47

用PyTorch可视化拆解CNN与MLP的本质联系与差异在咖啡厅里我常看到初学者对着厚厚的教材皱眉——那些关于卷积神经网络(CNN)和多层感知机(MLP)关系的数学公式就像天书般令人困惑。直到有天我随手在Jupyter里画了几行代码突然发现原来这两个看似不同的结构本质上是同一枚硬币的两面。本文将带您用PyTorch和Matplotlib通过可视化计算过程来直观理解这个深度学习中的重要概念。1. 环境准备与基础概念速览1.1 快速搭建实验环境我们先准备好实验所需的工具链。推荐使用Google Colab或本地Jupyter环境确保已安装最新版PyTorchimport torch import torch.nn as nn import matplotlib.pyplot as plt import numpy as np print(fPyTorch版本: {torch.__version__}) print(fCUDA可用: {torch.cuda.is_available()})1.2 CNN与MLP的简明定义CNN(卷积神经网络)通过局部感受野和权值共享处理网格状数据(如图像)的神经网络MLP(多层感知机)全连接网络每个神经元都与上一层的所有神经元相连关键疑问为什么说MLP是CNN的特例让我们用代码来验证这个命题。2. 从代码角度看CNN的退化过程2.1 构建等尺寸卷积核的CNN假设我们有一张3x3的灰度图像用CNN处理时故意将卷积核也设为3x3# 模拟3x3输入图像 input_img torch.tensor([[1,2,3], [4,5,6], [7,8,9]], dtypetorch.float32).unsqueeze(0).unsqueeze(0) # 定义3x3卷积核(与输入同尺寸) conv_layer nn.Conv2d(1, 1, kernel_size3, stride1, padding0, biasFalse) with torch.no_grad(): conv_layer.weight.data torch.ones_like(conv_layer.weight) * 0.1 # 统一权重方便观察 # 执行卷积操作 output conv_layer(input_img) print(f卷积输出: {output.squeeze()})此时卷积操作实际上是在进行全局加权求和——这与MLP的全连接操作已经非常相似。2.2 可视化计算过程让我们把计算过程画出来def visualize_operation(input_tensor, weight_tensor, operation_type): fig, ax plt.subplots(1, 2, figsize(10,4)) # 显示输入和权重 ax[0].imshow(input_tensor.squeeze(), cmapviridis) ax[0].set_title(Input Image) # 显示权重分布 ax[1].imshow(weight_tensor.squeeze(), cmapplasma) ax[1].set_title(f{operation_type} Weights) plt.tight_layout() plt.show() visualize_operation(input_img, conv_layer.weight.data, Convolution)当卷积核与输入同尺寸时每个输出像素都是所有输入像素的加权和——这正是全连接层的计算特性。3. MLP的卷积视角解读3.1 用1x1卷积实现MLP在PyTorch中我们可以用1x1卷积来模拟MLP的全连接操作# 将3x3图像展平为9维向量 flatten_input input_img.view(1, 1, -1) # 形状变为[1,1,9] # 定义等效的全连接层(实际是1x1卷积) mlp_layer nn.Conv1d(1, 1, kernel_size1, biasFalse) with torch.no_grad(): mlp_layer.weight.data torch.ones_like(mlp_layer.weight) * 0.1 # 执行全连接操作 mlp_output mlp_layer(flatten_input) print(fMLP输出: {mlp_output.squeeze()})3.2 计算过程的数学等价性让我们对比两种操作的数学表达式操作类型计算公式输出形状等尺寸CNN$output \sum_{i1}^{3}\sum_{j1}^{3} w_{ij}x_{ij}$标量展平MLP$output \sum_{k1}^{9} w_kx_k$标量关键发现当CNN的卷积核覆盖整个输入区域时其计算过程与MLP完全相同。4. 为什么图像处理不用退化版CNN4.1 空间信息丢失问题用代码演示使用全尺寸卷积核处理真实图像的问题from PIL import Image # 加载测试图像 img Image.open(test_image.jpg).convert(L).resize((224,224)) img_tensor torch.from_numpy(np.array(img)).float().unsqueeze(0).unsqueeze(0) # 定义全尺寸卷积(实际不可行) try: full_conv nn.Conv2d(1, 1, kernel_size224, stride1, padding0) output full_conv(img_tensor) except Exception as e: print(f错误: {e})实际问题参数量爆炸(224x224的卷积核有50,176个参数)无法捕捉局部特征计算复杂度呈指数增长4.2 局部感受野的优势对比通过表格对比两种方式的特性特性全尺寸卷积(MLP式)标准CNN参数量$O(n^2)$$O(k^2)$ (kn)空间信息完全丢失保留局部关系计算效率极低高平移不变性无有适用场景小规模结构化数据图像/视频等网格数据# 演示标准CNN处理图像的效果 normal_conv nn.Conv2d(1, 1, kernel_size3, padding1) output normal_conv(img_tensor) plt.figure(figsize(12,4)) plt.subplot(1,2,1) plt.title(原始图像) plt.imshow(img_tensor.squeeze(), cmapgray) plt.subplot(1,2,2) plt.title(3x3卷积结果) plt.imshow(output.detach().squeeze(), cmapgray) plt.show()5. 进阶理解网络结构中的灵活转换5.1 ResNet中的MLP与CNN混合在现代架构中常常能看到两者的混合使用。例如ResNet中的瓶颈结构class Bottleneck(nn.Module): def __init__(self, in_channels): super().__init__() self.conv1 nn.Conv2d(in_channels, 64, kernel_size1) # 1x1卷积(类似MLP) self.conv2 nn.Conv2d(64, 64, kernel_size3, padding1) # 标准卷积 self.conv3 nn.Conv2d(64, 256, kernel_size1) # 1x1卷积 def forward(self, x): return self.conv3(self.conv2(self.conv1(x)))设计要点1x1卷积用于降维/升维类似MLP的功能3x3卷积捕捉空间特征两者配合实现高效计算5.2 Vision Transformer中的特殊案例有趣的是Vision Transformer (ViT) 的处理方式# 模拟ViT的patch嵌入层 image torch.randn(1, 3, 224, 224) patch_size 16 num_patches (224 // patch_size) ** 2 # 将图像分割为16x16的patch并展平 patches image.unfold(2, patch_size, patch_size).unfold(3, patch_size, patch_size) patches patches.contiguous().view(1, num_patches, -1) # 形状[1, 196, 768] # 线性投影(本质是MLP) projection nn.Linear(patch_size*patch_size*3, 768) embedded projection(patches)这种处理实际上是将局部区域先展平再用MLP处理是另一种空间信息利用方式。

3PEAK思瑞浦 TPH2502-VR MSOP8 精密运放

特性单位增益带宽：250 MHz增益带宽积：120 MHz高压摆率：180 V/μs失调电压：最大值 2mV低噪声：6.5 nV/√Hz轨到轨输入和输出高输出电流：>100mA低噪声：在 1 kHz 时为 6nV/√Hz出色的视频性能&am…

2026/6/8 10:57:47 阅读更多

MATLAB处理GeoTIFF数据保姆级教程：从读取地理信息到保持投影批量导出，避坑指南都在这

MATLAB处理GeoTIFF数据全流程实战：从元数据解析到批量处理的最佳实践地理空间数据正在成为环境监测、城市规划、农业遥感等领域的核心资产。作为科研和工程领域的标配工具，MATLAB在处理这类带有地理坐标信息的栅格数据时，既展现了矩阵运算的先…

2026/6/8 10:57:26 阅读更多

零基础也能搞定！手把手教你用HTML+CSS复刻一个简约风个人主页（附完整源码）

从零到上线：用HTMLCSS打造你的首个个人主页全攻略第一次接触前端开发时，我盯着屏幕上闪烁的光标不知所措。直到亲手完成第一个能上线的个人主页，那种"原来如此"的顿悟感至今难忘。本文将带你完整走一遍这个神奇的过程——不需要任…

2026/6/8 10:57:05 阅读更多

强化学习入门：PPO/SAC在机器人控制中的第一行代码

文章目录每日一句正能量一、为什么机器人需要强化学习？二、PPO：稳定性的艺术 2.1 从策略梯度到PPO 2.2 PPO在机器人控制中的实现三、SAC：最大熵的艺术 3.1 从DDPG到SAC 3.2 SAC在机器人控制中的实现四、PPO vs SAC：机器人场景的选择五、Sim2Real关键：域随机化六、结…

2026/6/8 12:00:56 阅读更多

Mythos安全模型：从辅助工具到自主攻防代理的范式跃迁

1. 这不是一次普通模型发布：Mythos背后的真实技术断层与行业震感“Claude Mythos Preview”这行字出现在我浏览器标签页时，我正调试一个用Opus 4.6写的自动化渗透测试脚本。它卡在第三步——对一个老旧Java Web应用的Struts2漏洞链识别上，反复…

2026/6/8 12:00:15 阅读更多

Matlab水体提取工具包：带标注数据、可直接运行的CNN模型与全流程操作文档

本文还有配套的精品资源，点击获取简介：提供一套即装即用的Matlab水体识别解决方案，支持TIF和JPEG格式遥感或航拍图像输入，内含两张实测样本（image1.TIF、image2.jpg）及对应JSON标注文件，覆盖…

2026/6/8 11:59:54 阅读更多

Flutter 集成测试实战

Flutter 集成测试实战上篇文章讲了Flutter测试体系，这篇深入讲解集成测试（Integration Test）的编写、运行、CI/CD集成。集成测试 vs Widget测试对比项 Widget测试集成测试测试对象单个Widget 完整App流程运行环境模拟器/真机模拟器/真机速度快慢依赖 Flutter…

2026/6/8 11:59:33 阅读更多

i.MX 8M Mini功耗优化实战：从数据表到系统级调优策略

1. 项目概述：从数据表到实战，解读i.MX 8M Mini功耗优化全貌如果你正在基于NXP的i.MX 8M Mini设计一款对功耗敏感的产品，比如智能家居中控、便携式医疗设备或者电池供电的工业手持终端，那么你肯定不止一次地翻看过官方那份厚厚的《…

2026/6/8 11:59:33 阅读更多

如何高效使用DamaiHelper大麦抢票脚本：5个专业技巧告别抢票烦恼

如何高效使用DamaiHelper大麦抢票脚本：5个专业技巧告别抢票烦恼【免费下载链接】DamaiHelper 大麦网演唱会演出抢票脚本。项目地址: https://gitcode.com/gh_mirrors/dama/DamaiHelper 还在为抢不到心仪的演唱会门票而烦恼吗？DamaiHelper大麦抢…

2026/6/8 11:58:52 阅读更多

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现【免费下载链接】amlogic-s9xxx-armbian Supports running Armbian on Amlogic, Allwinner, and Rockchip devices. Support a311d, s922x, s905x3, s905x2, s912, s905d, s905x, …

2026/6/8 0:00:25 阅读更多

Python Scrapy 爬虫实战进阶系列（一）：轻量化数据存储 - 数据精准写入 SQLite 数据库

前言在 Python 爬虫开发领域中，Scrapy 作为高性能、高可扩展性的异步爬虫框架，是行业内采集结构化数据的首选工具。在中小型爬虫项目、本地数据采集、轻量化数据存储场景中，SQLite 无需独立服务、单文件存储、原生兼容 Python 的特性&#…

2026/6/8 0:00:45 阅读更多

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案【免费下载链接】btrfs WinBtrfs - an open-source btrfs driver for Windows 项目地址: https://gitcode.com/gh_mirrors/bt/btrfs 还在为Windows无法访问Linux Btrfs分区而烦恼吗？你是…

2026/6/8 0:03:08 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/8 0:06:11 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/8 0:06:11 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/8 0:06:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/8 9:43:25 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/8 9:43:23 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/8 9:43:30 阅读更多

相关文章

3PEAK思瑞浦 TPH2502-VR MSOP8 精密运放

MATLAB处理GeoTIFF数据保姆级教程：从读取地理信息到保持投影批量导出，避坑指南都在这

零基础也能搞定！手把手教你用HTML+CSS复刻一个简约风个人主页（附完整源码）

强化学习入门：PPO/SAC在机器人控制中的第一行代码

Mythos安全模型：从辅助工具到自主攻防代理的范式跃迁

Matlab水体提取工具包：带标注数据、可直接运行的CNN模型与全流程操作文档

Flutter 集成测试实战

i.MX 8M Mini功耗优化实战：从数据表到系统级调优策略

如何高效使用DamaiHelper大麦抢票脚本：5个专业技巧告别抢票烦恼

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现

Python Scrapy 爬虫实战进阶系列（一）：轻量化数据存储 - 数据精准写入 SQLite 数据库

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案

LED驱动技术全解析：从核心架构到实战选型与避坑指南

索引堆及其优化

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因