大模型入门-大模型蒸馏与微调2

发布时间：2026/5/18 13:41:21

Adapter Tuning轻量级参数高效微调法论文地址:https://arxiv.org/pdf/1902.00751什么是 Adapter Tuning适配器调整Adapter Tuning是一种参数高效微调方法通过在预训练模型的各层中插入轻量级的适配器模块Adapter Module仅训练这些模块来适配下游任务同时冻结原始模型的大部分参数。其核心目标是以极低的参数量通常为全量微调的0.5%~5%实现模型性能的快速适配显著降低计算与存储开销。适配器调整的设计主要基于以下几个关键想法参数隔离预训练模型已经包含了很多通用知识微调时不用大改只需要局部调整一下特定的特征表示就行。轻量添加在模型各层之间插入小型神经网络模块也就是适配器把它们当成任务相关特征的“插件”这样就不用直接修改模型原来的权重了。逐层适应适配器一般放在 Transformer 的多头注意力和前馈网络中间这样能一层一层地捕捉任务的相关信号。不影响推理训练完成后适配器就成了模型的一部分直接参与推理不用再额外调整模型结构。Adapter Tuning 的训练过程标准适配器模块由下投影Down-Projection和上投影Up-Projection构成中间引入非线性激活函数 A d a p t e r ( x ) x W u p ⋅ σ ( W d o w n ⋅ x ) Adapter(x)xW_{up}\cdot\sigma(W_{down}\cdot x)Adapter(x)xWup⋅σ(Wdown⋅x)其中各部分含义如下 W d o w n ∈ R d × r W_{down}\in\mathbb{R}^{d\times r}Wdown∈Rd×r负责将高维输入x ∈ R d x\in\mathbb{R}^{d}x∈Rd压缩到低维瓶颈空间满足r ≪ d r\ll dr≪d即瓶颈维度远小于原始维度。σ \sigmaσ非线性激活函数常用如 ReLU、GELU用于引入非线性变换。W u p ∈ R r × d W_{up}\in\mathbb{R}^{r\times d}Wup∈Rr×d把经过瓶颈层的低维特征重新映射回原始维度d并通过残差连接即公式中x . . . x...x...部分与原始输入融合。在实际的训练流程中包含以下几个关键步骤训练中先对预训练模型的主干权重如Transformer主体参数进行完全冻结使其不参与梯度更新以保留通用知识。接着仅针对适配器专属参数{ W d o w n , W u p } \{W_{down},W_{up}\}{Wdown,Wup}以及可能涉及的任务特定组件如分类头、回归头开展局部优化。最后通过在Transformer每个子层如多头注意力层、前馈网络层(FFN)之后插入 Adapter让模型能够逐层适配任务特征进而构建起层级化的任务适配能力。Adapter Tuning 的特点它参数高效可训练参数量仅为全量微调的0.1%-5% 。采用模块化设计适配器可独立增删支持多任务共享主干模型并动态切换任务。不存在推理延迟问题作为模型固有结构推理时无额外计算分支效率和原始模型一致。架构兼容性佳天然适配 Transformer 架构还能扩展到视觉、多模态模型像ViT、CLIP这类。LoRA低秩适配高效微调技术论文地址:https://arxiv.org/pdf/2106.09685什么是 LoRALoRA全称是 Low-Rank Adaptation是一种高效的模型微调技术。它的主要目标是在不影响模型性能的前提下减少训练参数的数量、降低计算和存储成本。传统的微调方法直接修改模型的全部参数或大部分参数这样做虽然能适应新任务但带来高昂的计算成本和显存占用。LoRA 的破局思路不去直接修改原始模型的大型权重矩阵LoRA 会为每一个被微调的矩阵引入一对低秩矩阵的补丁A和B并训练它们而不修改原始权重。怎么进行低秩矩阵分解我们可以通过一个具体的数学例子来理解其降参效果假设原参数矩阵维度为 N*d例如句长 512 * 维度 1024 。如果进行全参微调需要更新的参数量为512 * 1024 524,288个参数。使用 LoRA 时可以使用两个小矩阵进行模拟大矩阵例如矩阵 A 为 5124矩阵 B 为 41024此时仅要更新512*4 4*1024 6,144个参数降参效果显著6144 / 524288 ≈ 1.2%更新参数量降为全参微调的 1.2% 。核心逻辑通过将原始矩阵低秩矩阵分解成两个低秩矩阵冻结原始模型参数仅训练低秩矩阵 A 与 B其中秩r rr远小于原来维度。实际中如何进行 LoRA更新公式模型参数的更新遵循以下公式W u p d a t e d W o r i g i n a l B ⋅ A W_{updated}W_{original}B\cdot AWupdatedWoriginalB⋅A初始化策略矩阵 A随机初始化。矩阵 B必须全零初始化。这是为了保证模型能够基于原来性能进一步学习不至于直接训歪导致模型坍塌。微调与合并过程微调阶段实际使用时所有线性层都可以用 LoRA 进行微调。选定模型中需要插入 LoRA 的对应的层的矩阵把这些矩阵分别“补充”一对新的小矩阵 A 和 B维度分别是[ r , d ] [r, d][r,d]和[ d , r ] [d, r][d,r]其中 r 是秩d 是原始矩阵的层数。然后保持原始模型不变即冻结参数只微调这两个小矩阵 A 和 B 。合并与推理在小矩阵训练完成后将B ⋅ A B \cdot AB⋅A相乘的结果直接与原参数矩阵相加这不改变原来模型的结构与计算效率。局部生效这个操作只合并你插入过 LoRA 的位置没插过的地方比如你没选的矩阵或层保持不变。所以合并后的模型参数结构基本不变效果上相当于你用 LoRA 完整调好了那几个关键的螺丝。

量子随机测量技术：噪声环境下的纠缠增强方案

1. 量子随机测量技术前沿：噪声环境下的纠缠增强方案量子计算硬件近年来取得了显著进展，但实现大规模量子纠错（QEC）仍面临巨大挑战。在硬件持续改进的过程中，如何在噪声中尺度量子（NISQ）设备上开…

2026/5/18 13:41:21 阅读更多

ARM RealMonitor中断优化与RTOS集成实战

1. ARM RealMonitor核心机制解析 ARM RealMonitor作为嵌入式系统调试的核心组件，其设计直接影响目标系统的实时性能。理解其底层工作机制是进行优化的前提。 1.1 中断处理架构 RealMonitor默认采用混合中断处理模式，在保证调试功能的同时尽可能减少对系…

2026/5/18 13:41:21 阅读更多

Contextcore：轻量高性能的框架无关状态管理核心

1. 项目概述：一个为现代前端应用量身定制的状态管理核心如果你正在开发一个中大型的React、Vue或任何现代前端应用，并且对现有状态管理库的复杂性、样板代码量或者性能优化感到头疼，那么 lucifer-ux/Contextcore 这个项目很可能就是你一直…

2026/5/18 13:40:40 阅读更多

终极指南：如何在Windows电脑上实现AirPlay 2无线投屏功能

终极指南：如何在Windows电脑上实现AirPlay 2无线投屏功能【免费下载链接】airplay2-win Airplay2 for windows 项目地址: https://gitcode.com/gh_mirrors/ai/airplay2-win 还在为Windows电脑无法接收iPhone、iPad或Mac的屏幕镜像而烦恼吗？Airpl…

2026/5/18 17:10:17 阅读更多

抖音无水印下载终极指南：3分钟搞定批量下载的完整教程

抖音无水印下载终极指南：3分钟搞定批量下载的完整教程【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback suppo…

2026/5/18 17:10:17 阅读更多

GaussDB(DWS)运维实战：从一次慢查询排查，带你玩转pg_stat_activity与锁分析

GaussDB慢查询深度排查：从告警到根治的实战指南凌晨3点15分，监控系统突然弹出一条红色告警——某核心业务数据库查询响应时间超过15秒。作为值班DBA，我迅速连上跳板机，发现这不是简单的资源不足问题。通过一系列排查，…

2026/5/18 17:09:16 阅读更多

GCC __builtin函数避坑指南：让你的跨平台C代码在ARM和x86上都跑得稳

GCC __builtin函数跨平台避坑实战：ARM与x86兼容性深度解析在嵌入式开发与高性能计算领域，GCC编译器的__builtin函数集一直是开发者提升性能的利器。但当代码需要同时运行在ARM架构的嵌入式设备和x86架构的服务器上时，这些看似美妙的"魔…

2026/5/18 17:08:14 阅读更多

bitpoke/mysql-operator v0.6.3 下的 mysql backup to s3 卡死问题处理

1、问题收到 prometheus 告警。【TEST】 WARNING • KubeJobNotCompleted • 已恢复:12026-05-18T10:42:07+08:00 摘要✅ 已恢复告警 [1] infra/auto-2026-04-15t09-00-00-backup详请✅ 已恢复告警 [1]告警名称 : KubeJobNotCompleted告警级别 : WARNING实例 : infra/aut…

2026/5/18 17:07:13 阅读更多

PerimeterX PX3/PX2 按压验证码逆向：从初始化到WASM关键校验的完整流程剖析

1. PerimeterX按压验证码技术背景解析第一次遇到PerimeterX的PX3/PX2按压验证码时，我正帮朋友调试一个电商爬虫。那会儿鼠标按下去死活过不了验证，控制台里全是看不懂的加密参数。这种验证码和传统图形验证码完全不同，它更像一个完整的安全防…

2026/5/18 17:06:53 阅读更多

精益管理推不动？找准根源+避坑指南，破解全员参与难题

很多工厂推行精益管理，都陷入了管理层热、员工冷的尴尬困境：管理层耗费大量精力制定精益方案、投入资源，却始终推不动，一线员工要么被动应付，要么抵触反抗，不主动识别浪费、不参与改善，精益落地…

2026/5/18 10:35:25 阅读更多

基于React与Zustand构建现代化个人站点导航器：从设计到部署全解析

1. 项目概述：一个现代站点导航器的诞生最近在整理自己的浏览器书签和常用工具时，我发现自己陷入了一个典型的“数字混乱”状态。收藏夹里塞满了各种链接，从开发文档、设计资源到日常工具，杂乱无章。每次想找一个特定的网站&#x…

2026/5/18 10:35:25 阅读更多

开发团队如何通过 Taotoken 实现 API 密钥的统一管理与审计

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度开发团队如何通过 Taotoken 实现 API 密钥的统一管理与审计对于开发团队而言，安全、高效地管理大模型 API 密钥是一项…

2026/5/18 10:36:06 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/18 3:09:38 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/18 4:43:33 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/18 0:20:39 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/17 23:53:35 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/17 23:54:13 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/17 19:32:06 阅读更多

相关文章