VAE：原理+代码全解析

发布时间：2026/6/10 6:54:05

变分自编码器Variational AutoencoderVAE是深度学习中经典的生成模型之一它结合了自编码器的结构和变分推断的思想既能完成数据压缩又能实现数据生成。本文将从原理到代码一步步拆解VAE的核心逻辑。一、VAE的核心思想VAE的本质是通过学习数据的潜在分布实现从低维隐空间到高维数据空间的映射。和传统自编码器不同VAE不是直接学习输入到隐向量的确定性映射而是学习隐向量的概率分布这也是它能生成新数据的关键。1. 传统自编码器的局限传统自编码器由编码器和解码器组成编码器将输入数据压缩成固定维度的隐向量解码器再将隐向量还原为输入数据。但这种结构的隐空间是离散且无规律的无法通过采样隐向量生成新数据——比如在两个隐向量之间插值可能得到无意义的结果。2. VAE的改进引入概率分布VAE对编码器做了修改不再输出固定的隐向量而是输出隐向量的均值μ和方差σ²为了计算方便通常输出logσ²避免方差为负。然后从这个正态分布N(μ, σ²)中采样得到隐向量z再输入解码器还原数据。这个过程可以用两个核心步骤概括编码过程输入x → 编码器输出μ和logσ² → 采样得到z ~ N(μ, σ²)解码过程z → 解码器输出重构数据x̂3. VAE的损失函数VAE的损失由两部分组成重构损失和KL散度损失。1重构损失衡量解码器输出的重构数据x̂和原始输入x的差异通常用交叉熵损失针对图像等离散数据或均方误差针对连续数据Lrecon−Ez∼q(z∣x)[log⁡p(x∣z)]L_{recon} -\mathbb{E}_{z \sim q(z|x)}[\log p(x|z)]Lrecon−Ez∼q(z∣x)[logp(x∣z)]简单来说就是让重构数据尽可能接近原始数据。2KL散度损失KL散度用于衡量编码器输出的分布q(z|x)和预设的先验分布p(z)通常设为标准正态分布N(0,1)之间的差异LKLDKL(q(z∣x)∣∣p(z))12∑i1d(μi2σi2−log⁡σi2−1)L_{KL} D_{KL}(q(z|x) || p(z)) \frac{1}{2}\sum_{i1}^d (\mu_i^2 \sigma_i^2 - \log\sigma_i^2 - 1)LKLDKL(q(z∣x)∣∣p(z))21i1∑d(μi2σi2−logσi2−1)这部分损失的作用是约束隐空间的分布尽可能接近标准正态分布保证隐空间的连续性和规律性这样在隐空间中采样就能生成有意义的数据。最终VAE的总损失为LLreconLKLL L_{recon} L_{KL}LLreconLKL二、重参数化技巧这里有个关键问题如果直接从N(μ, σ²)中采样z反向传播时梯度无法通过采样操作传递因为采样是随机过程不可导。为了解决这个问题VAE引入了重参数化技巧将采样过程改写为zμσ⊙ϵ,ϵ∼N(0,1)z \mu \sigma \odot \epsilon, \quad \epsilon \sim N(0,1)zμσ⊙ϵ,ϵ∼N(0,1)其中⊙表示元素-wise乘法。这样一来采样的随机性转移到了ε上而μ和σ是编码器的输出梯度可以通过μ和σ反向传播解决了不可导的问题。三、PyTorch代码实现1. 定义VAE模型classVAE(nn.Module):def__init__(self,input_dim784,hidden_dim256,latent_dim20):super().__init__()self.encodernn.Sequential(nn.Linear(input_dim,hidden_dim),nn.ReLU(),nn.Linear(hidden_dim,hidden_dim),nn.ReLU())self.fc_munn.Linear(hidden_dim,latent_dim)self.fc_logvarnn.Linear(hidden_dim,latent_dim)self.decodernn.Sequential(nn.Linear(latent_dim,hidden_dim),nn.ReLU(),nn.Linear(hidden_dim,hidden_dim),nn.ReLU(),nn.Linear(hidden_dim,input_dim),nn.Sigmoid())defencode(self,x):hself.encoder(x)returnself.fc_mu(h),self.fc_logvar(h)defreparameterize(self,mu,log_var):stdtorch.exp(0.5*log_var)returnmutorch.randn_like(std)*stddefforward(self,x):mu,log_varself.encode(x)zself.reparameterize(mu,log_var)returnself.decode(z),mu,log_var2. 损失函数bce_lossnn.BCELoss(reductionsum)defloss_function(x_recon,x,mu,log_var):recon_lossbce_loss(x_recon,x)kl_loss-0.5*torch.sum(1log_var-mu.pow(2)-log_var.exp())returnrecon_losskl_loss3. 训练transformtransforms.Compose([transforms.ToTensor()])train_datasetdatasets.MNIST(root./data,trainTrue,downloadTrue,transformtransform)train_loaderDataLoader(train_dataset,batch_size128,shuffleTrue)devicetorch.device(cudaiftorch.cuda.is_available()elsecpu)modelVAE().to(device)optimizeroptim.Adam(model.parameters(),lr1e-3)forepochinrange(50):total_loss0fordata,_intrain_loader:datadata.view(-1,784).to(device)optimizer.zero_grad()x_recon,mu,log_varmodel(data)lossloss_function(x_recon,data,mu,log_var)loss.backward()total_lossloss.item()optimizer.step()print(fEpoch{epoch1}, Avg Loss:{total_loss/len(train_loader.dataset):.4f})4. 生成新数据model.eval()withtorch.no_grad():ztorch.randn(25,20).to(device)generated_imgsmodel.decode(z).cpu().numpy()⚠️注意本文仅为学习和理解算法进行 demo 代码实现线上和生产环境不建议使用。

Cybellum 固件包上传扫描流程操作手册

本文档详细介绍了在 Cybellum Platform 3.11 版本中上传固件包并进行 SCA（软件组成分析）扫描的完整操作流程。目录概述操作前准备操作步骤详解步骤一：进入组件管理页面步骤二：创建新组件步骤三：填写组件基本信息步…

2026/6/10 6:51:22 阅读更多

STM32-Day05（补充库函数GPIO输入硬件了解）

3.2.7 补充知识点调用库函数的方法：1、直接通过.h文件，拖到最下面，看有哪些函数可以调用，再右键转到定义，查看一下函数和参数的用法2、使用文件夹中的库函数使用手册，中文文档可以直接使用，但是…

2026/6/10 6:51:22 阅读更多

多设备协同计算深度实战：昇腾NPU集群编程与资源调度完全指南

前言在昇腾CANN软件栈的完整生态中，多设备协同计算是实现大规模并行计算的关键技术。对于需要在多昇腾NPU上运行复杂模型的开发者而言，掌握协同计算的编程方法和资源调度策略是充分发挥昇腾集群性能的核心技能。多设备协同涉及计算划分、数据分发、结果…

2026/6/10 6:50:21 阅读更多

项目管理资源合集

2025年5月最新江山软考高级信息系统项目管理师文件大小: 41.3GB下载链接: https://pan.quark.cn/s/d2dab1651ce7 （软考中级）系统集成项目管理工程师文件大小: 8.7GB下载链接: https://pan.quark.cn/s/e3f4d97bbc68 《项目管理训练营》-第4期升级版…

2026/6/10 7:57:32 阅读更多

CBCX怎么样？围绕投教支持与信息透明度展开评测

当用户从更成熟的角度选择平台时，稳定体验和规范表达往往比单一卖点更重要。外汇服务行业进入更重视规范表达和用户保护的阶段后，平台评测也需要从多个细节展开。CBCX受到关注的原因，不只在于品牌露出，更在于它能否围绕稳定运行、…

2026/6/10 7:56:11 阅读更多

四年后的今天，博士毕业啦|贴一些开源代码的链接（故障监测+加强学习预测模型+能源互补性分析）

偶然查看这个账号的消息，发现收到通知，离第一篇文章发表四年了。上次发文还是1024天，替当时师弟建的Simulink变压器模型，现在师弟已经可以独当一面了！（作为练手用此模型发了两篇会议文章。） …

2026/6/10 7:56:11 阅读更多

【CVPR 2026即插即用模块】SCACA空间-通道丰度交叉注意力机制，适合高光谱图像超分辨率、高光谱图像融合、多光谱-高光谱融合、图像恢复、目标检测、医学多模态图像融合等CV任务通用，涨点起飞！

一、论文信息本文目录一、论文信息二、论文摘要概况三、SCACA空间-通道丰度交叉注意力机制结构图四、SCACA模块的作用五、SCACA模块的原理六、SCACA模块的优势七、即插即用模块代码论文题目：Enhancing Unregistered Hyperspectral Image Super-…

2026/6/10 7:55:51 阅读更多

Hi3519A平台IMX377+TP2850双路图像采集驱动包，含热光/可见光同步采集与Caffe融合参考实现

本文还有配套的精品资源，点击获取简介：基于海思Hi3519A芯片，提供IMX377可见光摄像头与TP2850模拟视频解码芯片的双路图像同步采集支持，可稳定输出两路原始图像流。驱动包包含已验证的tp2850.ko内核模块、完整编译配置&#xf…

2026/6/10 7:55:30 阅读更多

ComfyUI-Impact-Pack V8终极安装指南：快速解锁AI图像增强的强大功能

ComfyUI-Impact-Pack V8终极安装指南：快速解锁AI图像增强的强大功能【免费下载链接】ComfyUI-Impact-Pack Custom nodes pack for ComfyUI This custom node helps to conveniently enhance images through Detector, Detailer, Upscaler, Pipe, and more. 项目地…

2026/6/10 7:55:30 阅读更多

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析【免费下载链接】NomNom NomNom is the most complete savegame editor for NMS but also shows additional information around the data youre about to change. You can also easily look up each …

2026/6/10 0:00:34 阅读更多

从导航软件到游戏寻路：用C++手把手实现Dijkstra最短路径算法（附完整代码）

从导航软件到游戏寻路：用C手把手实现Dijkstra最短路径算法每次打开手机地图导航，或是操控游戏角色穿越复杂地形时，背后都藏着一个数学魔法——最短路径算法。Dijkstra算法作为图论中的经典解决方案，从1956年诞生至今，已…

2026/6/10 0:01:14 阅读更多

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱，支持下载视频、番剧等等各类资源项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/6/10 0:02:17 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/10 0:41:57 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/10 0:41:54 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/10 0:32:14 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/9 9:53:26 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…