训练和微调

发布时间：2026/5/20 3:35:13

训练和微调微调本质上就是在调整更新模型的参数。当我们说“调整参数”时指的是调整神经网络内部数以亿计的权重Weights和偏置Biases。全量微调Full Fine-Tuning把模型的所有参数全部解锁用新数据重新训练一遍。高效微调PEFT如 LoRA把模型原本的参数“冻结”保持不变只在旁边外挂一小部分新参数只训练这部分新参数。但无论哪种改变的都是数学意义上的权重参数。微调是广义训练的一种。预训练Pre-training / 也就是常说的“训练”从零开始参数随机初始化给模型吞下几万亿 Token 的无标订购本比如整个互联网的网页、图书让模型学会人类语言的语法、常识和逻辑。这是从无到有的过程耗资巨大千万级人民币。微调Fine-tuning在已经具备通用能力的预训练模型基础上使用特定领域的精细数据进行“二次训练”。这是从及格到优秀、从通用到专用的过程。什么是 LoRA 指令微调1. 传统微调的痛点假设你要微调一个 70B700 亿参数的模型。如果做全量微调你需要同时更新 700 亿个参数。这不仅需要极其恐怖的显存几百 GB 甚至上 TB而且训练完后你每针对一个场景微调就要存一个 140GB 的完整模型文件存储成本极高。2. LoRA 的底层原理低秩适应Low-Rank AdaptationLoRA 的核心思想是原模型的底层大矩阵太重了我们不碰它;我们在它旁边贴两个小矩阵作为“补丁”。冻结原模型模型原有的几百亿参数全部锁定不接收梯度更新变成“只读”。旁路降维矩阵在原模型的矩阵旁边增加两个低维度的矩阵$A$和$B$。原矩阵如果是$4096 \times 4096$的大小LoRA 会把它拆解为$4096 \times r$和$r \times 4096$的两个小矩阵其中$r$通常设得很小比如 8 或 16。数学运算输入数据同时走原矩阵和 LoRA 矩阵最后把结果相加$Y W_0X \Delta WX W_0X (B \times A)X$。惊人的优势需要训练的参数量直接暴降到原来的1% 甚至 0.1%。4090 级别的消费级显卡就能玩得转。微调完后产出的模型文件LoRA 权重只有几十兆到几百兆可以像插件一样随时插拔。3. “LoRA指令微调”的实操指令过程当你使用上述提到的框架进行 LoRA 指令微调时底层的核心运行逻辑如下以命令行脚本为例LLaMA-Factory巴什# 启动 LLaMA-Factory 进行 LoRA 指令微调 llamafactory-cli train \ --stage sft \ # 阶段SFT监督微调/指令微调 --model_name_or_path /path/to/Qwen2.5 \ # 基础大模型路径 --dataset my_instruction_data \ # 你的指令微调数据集 --finetuning_type lora \ # 微调类型明确指定为 LoRA --lora_target q_proj, v_proj \ # 将 LoRA 补丁贴在注意力机制的 Q, V 矩阵上 --output_dir /path/to/lora_weights \ # 训练好后的 LoRA 补丁保存路径 --per_device_train_batch_size 4 \ # 显存控制单卡批次 --learning_rate 5e-5 \ # 学习率微调参数的步长 --fp16 # 开启半精度加速训练结束后你会得到什么你不会得到一个新的大模型而是得到一组和文件。在部署上线时合并脚本会底层的把这两个“小补丁文件”融合进原本只读的大模型中你的大模型就完成了进化学会了听懂你特定业务的指令。

从傅里叶到拉普拉斯：给信号处理新手的直观对比指南（附性质对照表）

从傅里叶到拉普拉斯：给信号处理新手的直观对比指南信号处理领域的数学工具往往让初学者望而生畏。当你刚掌握傅里叶变换的基本概念，迎面而来的拉普拉斯变换又带来新的困惑。这两种变换究竟有何关联？为何工程师需要掌握两种看似相似的分析工具…

2026/5/20 3:35:13 阅读更多

告别信号‘自消’：深入浅出聊聊波束形成中协方差矩阵重建与对角加载的‘抗干扰’哲学

波束形成中的抗干扰艺术：从鸡尾酒会到协方差矩阵重建想象一下，你正站在一个嘈杂的鸡尾酒会上，试图听清对面朋友说的话。周围此起彼伏的交谈声、酒杯碰撞声、背景音乐交织在一起，形成了一堵声墙。这时，你会不自觉地调整…

2026/5/20 3:34:33 阅读更多

Keil MDK堆栈监控功能详解与实战应用

1. 项目概述在嵌入式开发领域，堆栈使用监控一直是个令人头疼的问题。作为一名长期使用Keil MDK进行ARM开发的工程师，我深知堆栈溢出带来的噩梦——系统莫名其妙崩溃，问题难以复现，调试过程如同大海捞针。Keil MDK 5.14引入的Stack…

2026/5/20 3:34:13 阅读更多

硬件工程师的“抠门”艺术：手把手教你用分立方案实现uA级静态功耗的电池电压监控

硬件工程师的“抠门”艺术：手把手教你用分立方案实现uA级静态功耗的电池电压监控在物联网设备和可穿戴技术爆发的今天，功耗优化已成为硬件设计的核心竞争力。我曾为一个长期部署在野外的环境监测设备苦思冥想——如何在保证数据采集精度的前提下&#x…

2026/5/20 11:31:16 阅读更多

快去薅捷配免费打样！1-6 层板都能免，企业认证每月 2 次，个人每月 1 次，五不限 + 免费包邮，工程师闭眼冲！

工程师福利！捷配免费打样，真・无套路薅羊毛作为常年和 PCB 打交道的电子工程师，打样真的是一笔不小的开销。最近一直在用捷配的免费打样，实测靠谱、无套路，分享给大家。一、免费打样福利1~6 层 PCB 均可免费打样单双…

2026/5/20 11:29:54 阅读更多

Perplexity财经数据查询：如何用自然语言1秒提取SEC/EDGAR原始文件中的非结构化财务风险信号？

更多请点击： https://kaifayun.com 第一章：Perplexity财经数据查询：如何用自然语言1秒提取SEC/EDGAR原始文件中的非结构化财务风险信号？ Perplexity 的财经数据查询能力并非依赖传统关键词匹配，而是基于其多跳推理架构…

2026/5/20 11:29:54 阅读更多

吃透 SAP Fiori Launchpad Content Assignment：从 Catalog、Role 到 Spaces and Pages 的完整落地路径

在很多 SAP Fiori 项目里，应用开发完成并不意味着用户马上就能在 Launchpad 上看到它。哪怕你的 SAP UI5 或 Fiori Elements 应用已经跑通，OData 服务也正常，用户端依旧可能出现两个最常见的问题：一个是根本看不到应用入口，另一个是看得到 tile 却点不开。真正决定应用如何…

2026/5/20 11:29:33 阅读更多

从外业飞到内业出图：一次完整的精灵4Pro倾斜摄影建模实战（含Pix4D与Smart3D双流程）

从外业飞到内业出图：精灵4Pro倾斜摄影建模全流程实战指南当精灵4Pro的螺旋桨划破清晨的空气，你手中的遥控器不仅操控着一台无人机，更是在编织一个三维数字世界的雏形。倾斜摄影技术正在重塑测绘行业的作业方式——通过五个镜头同时捕捉地物的…

2026/5/20 11:28:31 阅读更多

STM32F407的MBD实战：手把手教你配置Simulink模型与CubeMX生成的Keil工程对接

STM32F407的MBD实战：手把手教你配置Simulink模型与CubeMX生成的Keil工程对接在嵌入式开发领域，基于模型的设计（MBD）正逐渐成为提升开发效率的利器。对于已经熟悉STM32CubeMX和Simulink独立使用的开发者来说，将两者生成…

2026/5/20 11:28:31 阅读更多

顶伯在线语音工具背后的技术力量：AI语音合成与深度学习解析

顶伯在线语音工具背后的技术力量在人工智能浪潮中，语音交互正成为人机沟通的核心方式。顶伯作为行业领先的在线语音工具，凭借自主研发的深度学习架构，将文字转化为高度自然的语音，广泛应用于有声阅读、智能客服、教育辅助等领域。…

2026/5/20 0:00:25 阅读更多

全志V3s开发板实战：用Buildroot 2020.02.4定制你的第一个最小Linux文件系统

全志V3s开发板实战：用Buildroot 2020.02.4定制最小Linux文件系统在嵌入式开发领域，构建一个精简高效的Linux文件系统往往是项目成功的关键第一步。全志V3s作为一款高性价比的ARM Cortex-A7芯片，搭配Buildroot这一经典构建工具，能…

2026/5/20 0:00:25 阅读更多

百考通：AI赋能期刊论文写作，智能生成优质内容

在学术研究领域，期刊论文的撰写是成果输出的关键环节，却也让众多科研工作者与学生倍感压力：选题迷茫、逻辑梳理困难、格式规范复杂、内容提炼耗时，严重拖慢了学术成果的发表节奏。百考通（https://www.baikaotongai.com…

2026/5/20 0:00:46 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/20 5:14:40 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/19 6:17:20 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/20 2:02:06 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/20 5:46:58 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/20 3:00:53 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/19 22:33:20 阅读更多

相关文章