大模型|开源大模型和大模型微调

发布时间：2026/5/20 7:26:31

欢迎来到人工智能的世界博客主页卿云阁欢迎关注点赞收藏⭐️留言首发时间2026年5月19日✉️希望可以和大家一起完成进阶之路作者水平很有限如果发现错误请留言轰炸哦万分感谢目录开源大模型开源大模型和闭源大模型开源大模型对比开源大模型的应用场景大模型微调模型微调效果和简介模型微调的流程数据收集模型选择模型微调模型评估开源大模型开源大模型和闭源大模型闭源大模型的局限性缺乏灵活性无法自定义限制业务创新和优化。依赖供应商受制于第三方存在价格波动和服务中断风险。隐私风险数据上传到外部可能不符合法规要求。成本高按量计费长期使用费用较高。开源大模型的优势可定制可以灵活调整满足业务需求。低成本减少对高价 API 的依赖。数据安全可以私有部署防止数据泄露符合合规要求。开源大模型可以私有化部署成为垂直领域的专有大模型开源大模型对比开源大模型的应用场景开源大模型在医疗健康领域的应用表现对比开源大模型如 LLaMA在医疗场景下专业性不足专业医疗大模型通过领域微调或知识增强能提供更精准、可执行的医疗建议大模型微调模型微调效果和简介微调的核心就是给大模型大量“指令-输入-输出”示例让它学会在指定场景下产生专业且高质量的输出。通过这种方式模型能够从通用大模型转变为垂直领域专家模型例如医疗、环境、金融等专业领域。数据格式包含三部分instruction → 模型要做的任务策略和目标input → 模型执行任务的具体信息上下文可为空output → 模型的目标输出训练/微调的参考答案模型微调的流程数据收集01收集领域相关的指令-输入-输出数据用于微调大模型。模型选择02选择适合微调的基础大模型如 LLaMA、Qwen 等。模型微调03使用收集的数据对模型进行微调训练使模型掌握领域知识和特定任务能力。模型评估04对微调后的模型进行性能评估确保生成内容符合预期并具备专业性。微调比例影响模型的能力平衡同时保留通用能力和提升领域能力需要合理混合通用数据与领域数据领域微调必须注意避免灾难性遗忘通用数据 : 领域数据微调效果1 : 0只具备通用问答能力无法处理领域任务1 : 1保持通用能力同时可以完成领域相关任务0 : 1仅能完成领域任务但通用能力丢失灾难性遗忘通用数据 : 领域数据能力类型微调前微调后1 : 0通用能力评估大学各科测试80-9090医疗能力评估中文临床测试60-7020-301 : 1通用能力评估80-9080-90医疗能力评估60-7080-900 : 1通用能力评估80-9020-30医疗能力评估60-7080-90数据收集通用微调数据集的收集收集的通用微调数据既有问答、翻译、对话任务也有编程和多模态任务。英文数据和代码数据在微调中承担保护基础能力和增强专业能力的双重作用。名称语言数据量数据内容质量alpaca_dataset中/英文52K常规问答数据集高COIG中文191K通用翻译指令、考试指令、代码指令数据集等高ShareGPT中/英文90K中英文平行双语优质人机问答数据集中HC3中/英文40K/8.4K人类真实回复结果与 ChatGPT 回复结果的 QA 数据集中firefly中文1.1M23 种常见中文 NLP 任务高ultrachat英文1.4M英文多轮对话数据中领域微调数据集的收集网页爬取从行业相关网站、论坛、文档中爬取结构化或非结构化数据形成训练数据。大模型蒸馏:使用已有的大模型生成高质量领域问答或文本通过“教师模型→学生模型”方式获取微调数据。基于下游任务的数据集构造:针对具体任务如医疗问答、环境监测报告分析、金融风控文本理解构造训练数据确保数据与实际业务场景高度相关。网页爬取提取网页数据→数据清洗→构建数据模型选择基于模型榜单能力选型、微调多语言聊天机器人优先选多语言评分最优的处理中文医疗问答需复杂知识查询与推理选择知识、推理评分双高的。微调医疗领域大模型流程明确临床医疗问答、术语标准化等微调任务选定 chatglm3‑6B、qwen‑7B 等候选模型收集 10 道相关测试题通过答题打分评估模型性能择优确定微调基模型。任务模型人工平均打分回复质量临床医疗问答chatglm3-6B8.4分分点回答质量较高qwen-7B9.0分分点回答质量高术语标准化chatglm3-6B8.0分格式正确qwen-7B8.0分格式正确模型微调全参数微调更新模型全部参数缺点显存成本高、训练效率低、小样本易过拟合适用场景算力充足、拥有大规模训练数据PEFT 参数高效微调冻结大部分参数仅训练少量参数添加型方法适配器Adapters代表 BN Adapter在 Transformer 层插入可训练模块软提示Soft Prompts代表 Prefix‑Tuning在输入嵌入中增加可训练张量选择型方法冻结法Freeze冻结模型浅层仅训练深层语义层重参数化法LoRA 低秩适配主流 PEFT 方法增设低秩旁路矩阵参数与显存消耗大幅降低效果接近全参数微调。Swift 工具适合有一定模型训练经验的用户追求极致速度和效率。LLaMA-Factory 工具适合没有模型训练经验的人提供可视化操作界面快速上手。全栈微调工具LLaMA-Factoryhttps://github.com/hiyouga/LLaMA-Factory轻量级微调工具Swifthttps://github.com/modelscope/ms-swift模型评估自动化评估偏向客观、量化适合可标准化测量的任务。人工/大模型评估偏向主观、质量多维度评价适合创意或复杂文本生成。

5分钟掌握碧蓝航线自动化脚本：解放双手的智能游戏助手终极指南

5分钟掌握碧蓝航线自动化脚本：解放双手的智能游戏助手终极指南【免费下载链接】AzurLaneAutoScript Azur Lane bot (CN/EN/JP/TW) 碧蓝航线脚本 | 无缝委托科研，全自动大世界项目地址: https://gitcode.com/gh_mirrors/az/AzurLaneAutoScript 你…

2026/5/20 7:26:31 阅读更多

从IMX334到HDMI输入：Hi3559AV100 MPP代码中VI参数配置的保姆级调整指南

从IMX334到HDMI输入：Hi3559AV100 MPP代码中VI参数配置实战解析当我们需要将Hi3559AV100开发板从默认的IMX334 MIPI摄像头切换为HDMI输入时，整个视频输入(VI)通道的参数配置需要彻底重构。这不仅涉及硬件接口的转换，更需要深入理解MPP框架中V…

2026/5/20 7:26:31 阅读更多

大型环境试验舱温控系统性能提升方法【附仿真】

✨ 长期致力于大型环境试验舱、热负荷分析、温度控制算法、联合仿真、螺旋弹性管换热器研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1）冷热端温度动态…

2026/5/20 7:25:50 阅读更多

从电位器到数字音量：手把手拆解音响功放里的6种音量控制电路（含MOS管/IC/数字电位器）

从电位器到数字音量：手把手拆解音响功放里的6种音量控制电路（含MOS管/IC/数字电位器） 在音响系统的设计中，音量控制电路往往是最容易被忽视却又至关重要的环节。一个优秀的音量控制方案不仅需要精确调节信号强度，还要尽…

2026/5/20 8:37:34 阅读更多

3分钟掌握MPC Video Renderer：免费开启Windows高清视频播放新体验

3分钟掌握MPC Video Renderer：免费开启Windows高清视频播放新体验【免费下载链接】VideoRenderer Внешний видео-рендерер 项目地址: https://gitcode.com/gh_mirrors/vi/VideoRenderer 你是否厌倦了Windows系统上平淡无奇的视频播放效…

2026/5/20 8:37:14 阅读更多

Ubuntu虚拟机磁盘空间耗尽导致MySQL启动失败的系统恢复与预防指南

1. 问题现象与核心原因剖析最近在折腾Ubuntu虚拟机时，遇到了一个挺典型的开机故障：系统启动时卡住，屏幕上赫然显示着“Failed to start MySQL Community Server”的错误信息，紧接着系统就停滞不前，无法进入图形界面。这…

2026/5/20 8:37:14 阅读更多

告别本地配环境！MonkeyCode开箱实测：Excel秒变可视化大屏

用过 Cursor、Claude Code 的朋友都知道，AI 编程工具确实能提升效率，但有个绕不开的门槛：本地环境配置。你要先装 Node、配 Python 虚拟环境、装各种依赖…… 折腾一圈下来，热情已经消耗了一半。而且很多工具还要你自己去接 API K…

2026/5/20 8:36:54 阅读更多

3步解锁完全离线的Windows实时语音识别：TMSpeech让你的语音秒变文字

3步解锁完全离线的Windows实时语音识别：TMSpeech让你的语音秒变文字【免费下载链接】TMSpeech 腾讯会议摸鱼工具项目地址: https://gitcode.com/gh_mirrors/tm/TMSpeech 你是否厌倦了依赖网络的云端语音识别服务？担心隐私泄露，又想要…

2026/5/20 8:36:33 阅读更多

三步掌握Ryzen处理器深度调试：SMUDebugTool实战指南

三步掌握Ryzen处理器深度调试：SMUDebugTool实战指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gitc…

2026/5/20 8:35:52 阅读更多

顶伯在线语音工具背后的技术力量：AI语音合成与深度学习解析

顶伯在线语音工具背后的技术力量在人工智能浪潮中，语音交互正成为人机沟通的核心方式。顶伯作为行业领先的在线语音工具，凭借自主研发的深度学习架构，将文字转化为高度自然的语音，广泛应用于有声阅读、智能客服、教育辅助等领域。…

2026/5/20 0:00:25 阅读更多

全志V3s开发板实战：用Buildroot 2020.02.4定制你的第一个最小Linux文件系统

全志V3s开发板实战：用Buildroot 2020.02.4定制最小Linux文件系统在嵌入式开发领域，构建一个精简高效的Linux文件系统往往是项目成功的关键第一步。全志V3s作为一款高性价比的ARM Cortex-A7芯片，搭配Buildroot这一经典构建工具，能…

2026/5/20 0:00:25 阅读更多

百考通：AI赋能期刊论文写作，智能生成优质内容

在学术研究领域，期刊论文的撰写是成果输出的关键环节，却也让众多科研工作者与学生倍感压力：选题迷茫、逻辑梳理困难、格式规范复杂、内容提炼耗时，严重拖慢了学术成果的发表节奏。百考通（https://www.baikaotongai.com…

2026/5/20 0:00:46 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/20 5:14:40 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/19 6:17:20 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/20 2:02:06 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/20 5:46:58 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/20 3:00:53 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/19 22:33:20 阅读更多

相关文章