LlamaFactory的微调指令

发布时间：2026/5/24 13:20:50

我们提供了多样化的大模型微调示例脚本。请确保在LLaMA-Factory目录下执行下述命令。目录LoRA 微调QLoRA 微调全参数微调合并 LoRA 适配器与模型量化推理 LoRA 模型杂项使用CUDA_VISIBLE_DEVICESGPU或ASCEND_RT_VISIBLE_DEVICESNPU选择计算设备。LLaMA-Factory 默认使用所有可见的计算设备。基础用法llamafactory-cli train examples/train_lora/qwen3_lora_sft.yaml高级用法CUDA_VISIBLE_DEVICES0,1 llamafactory-cli train examples/train_lora/qwen3_lora_sft.yaml \ learning_rate1e-5 \ logging_steps1bash examples/train_lora/qwen3_lora_sft.sh示例LoRA 微调增量预训练llamafactory-cli train examples/train_lora/qwen3_lora_pretrain.yaml指令监督微调llamafactory-cli train examples/train_lora/qwen3_lora_sft.yaml多模态指令监督微调llamafactory-cli train examples/train_lora/qwen3vl_lora_sft.yamlDPO/ORPO/SimPO 训练llamafactory-cli train examples/train_lora/qwen3_lora_dpo.yaml多模态 DPO/ORPO/SimPO 训练llamafactory-cli train examples/train_lora/qwen3vl_lora_dpo.yaml奖励模型训练llamafactory-cli train examples/train_lora/qwen3_lora_reward.yamlKTO 训练llamafactory-cli train examples/train_lora/qwen3_lora_kto.yaml预处理数据集对于大数据集有帮助在配置中使用tokenized_path以加载预处理后的数据集。llamafactory-cli train examples/train_lora/qwen3_preprocess.yaml多机指令监督微调FORCE_TORCHRUN1 NNODES2 NODE_RANK0 MASTER_ADDR192.168.0.1 MASTER_PORT29500 llamafactory-cli train examples/train_lora/qwen3_lora_sft.yaml FORCE_TORCHRUN1 NNODES2 NODE_RANK1 MASTER_ADDR192.168.0.1 MASTER_PORT29500 llamafactory-cli train examples/train_lora/qwen3_lora_sft.yaml支持弹性和容错的多机指令监督微调要启动一个支持弹性节点和容错的多机指令微调在每个节点上执行以下命令。弹性节点数量范围为MIN_NNODES:MAX_NNODES每个节点最多允许因为错误重启MAX_RESTARTS次。RDZV_ID应设置为一个唯一的作业 ID由参与该作业的所有节点共享。更多新可以参考官方文档 torchrun。FORCE_TORCHRUN1 MIN_NNODES1 MAX_NNODES3 MAX_RESTARTS3 RDZV_IDllamafactory MASTER_ADDR192.168.0.1 MASTER_PORT29500 llamafactory-cli train examples/train_full/qwen3_full_sft.yaml使用 DeepSpeed ZeRO-3 平均分配显存FORCE_TORCHRUN1 llamafactory-cli train examples/train_lora/qwen3_lora_sft_ds3.yaml使用 Ray 在 4 张 GPU 上微调USE_RAY1 llamafactory-cli train examples/train_lora/qwen3_lora_sft_ray.yamlQLoRA 微调基于 4/8 比特 Bitsandbytes/HQQ/EETQ 量化进行指令监督微调推荐llamafactory-cli train examples/train_qlora/qwen3_lora_sft_otfq.yaml在 NPU 上基于 4 比特 Bitsandbytes 量化进行指令监督微调llamafactory-cli train examples/train_qlora/qwen3_lora_sft_bnb_npu.yaml基于 4/8 比特 GPTQ 量化进行指令监督微调llamafactory-cli train examples/train_qlora/llama3_lora_sft_gptq.yaml基于 4 比特 AWQ 量化进行指令监督微调llamafactory-cli train examples/train_qlora/llama3_lora_sft_awq.yaml基于 2 比特 AQLM 量化进行指令监督微调llamafactory-cli train examples/train_qlora/llama3_lora_sft_aqlm.yaml全参数微调在单机上进行指令监督微调FORCE_TORCHRUN1 llamafactory-cli train examples/train_full/qwen3_full_sft.yaml在多机上进行指令监督微调FORCE_TORCHRUN1 NNODES2 NODE_RANK0 MASTER_ADDR192.168.0.1 MASTER_PORT29500 llamafactory-cli train examples/train_full/qwen3_full_sft.yaml FORCE_TORCHRUN1 NNODES2 NODE_RANK1 MASTER_ADDR192.168.0.1 MASTER_PORT29500 llamafactory-cli train examples/train_full/qwen3_full_sft.yaml多模态指令监督微调FORCE_TORCHRUN1 llamafactory-cli train examples/train_full/qwen3vl_full_sft.yaml合并 LoRA 适配器与模型量化合并 LoRA 适配器注请勿使用量化后的模型或quantization_bit参数来合并 LoRA 适配器。llamafactory-cli export examples/merge_lora/qwen3_lora_sft.yaml使用 AutoGPTQ 量化模型llamafactory-cli export examples/merge_lora/qwen3_gptq.yaml保存 Ollama 配置文件llamafactory-cli export examples/merge_lora/qwen3_full_sft.yaml推理 LoRA 模型使用 vLLM 多卡推理评估python scripts/vllm_infer.py --model_name_or_path Qwen/Qwen3-4B-Instruct-2507 --template qwen3_nothink --dataset alpaca_en_demo python scripts/eval_bleu_rouge.py generated_predictions.jsonl使用命令行对话框llamafactory-cli chat examples/inference/qwen3_lora_sft.yaml使用浏览器对话框llamafactory-cli webchat examples/inference/qwen3_lora_sft.yaml启动 OpenAI 风格 APIllamafactory-cli api examples/inference/qwen3_lora_sft.yaml杂项使用 GaLore 进行全参数训练llamafactory-cli train examples/extras/galore/llama3_full_sft.yaml使用 APOLLO 进行全参数训练llamafactory-cli train examples/extras/apollo/llama3_full_sft.yaml使用 BAdam 进行全参数训练llamafactory-cli train examples/extras/badam/llama3_full_sft.yaml使用 Adam-mini 进行全参数训练llamafactory-cli train examples/extras/adam_mini/qwen2_full_sft.yaml使用 Muon 进行全参数训练llamafactory-cli train examples/extras/muon/qwen2_full_sft.yamlLoRA 微调llamafactory-cli train examples/extras/loraplus/llama3_lora_sft.yamlPiSSA 微调llamafactory-cli train examples/extras/pissa/llama3_lora_sft.yaml深度混合微调llamafactory-cli train examples/extras/mod/llama3_full_sft.yamlLLaMA-Pro 微调bash examples/extras/llama_pro/expand.sh llamafactory-cli train examples/extras/llama_pro/llama3_freeze_sft.yamlFSDPQLoRA 微调bash examples/extras/fsdp_qlora/train.shOFT 微调llamafactory-cli train examples/extras/oft/llama3_oft_sft.yamlQOFT 微调llamafactory-cli train examples/extras/qoft/llama3_oft_sft_bnb_npu.yaml

别再死记硬背NLL公式了！用PyTorch手把手带你复现一个分类任务（附完整代码）

从零实现NLL损失函数：PyTorch实战图像分类任务刚接触机器学习的同学一定对"负对数似然损失"这个术语不陌生，但真正理解它如何在实际代码中发挥作用的人却不多。今天我们不谈复杂的数学推导，而是直接动手用PyTorch实现一个完整的分…

2026/5/23 17:14:03 阅读更多

保姆级教程：手把手教你用Vue 3 + TypeScript封装一个媲美Element UI的Slider滑块组件

工程化实践：用Vue 3 TypeScript构建企业级Slider组件库在当今前端开发领域，组件化开发已成为提升效率的关键。本文将深入探讨如何运用Vue 3和TypeScript构建一个高可用、强类型的Slider滑块组件，不仅满足基础功能需求，更注重工程…

2026/5/23 5:27:25 阅读更多

油猴脚本进阶：如何精准拦截B站、知乎等特定网站的Fetch请求而不‘误伤’？

油猴脚本进阶：如何精准拦截B站、知乎等特定网站的Fetch请求而不‘误伤’？ 在浏览器自动化工具中，油猴脚本（Tampermonkey）因其轻量级和灵活性备受开发者青睐。特别是对于需要拦截和修改网页请求的中高级用户来说&#…

2026/5/23 12:45:59 阅读更多

5分钟快速上手Label Studio：终极开源数据标注工具完整指南

5分钟快速上手Label Studio：终极开源数据标注工具完整指南【免费下载链接】label-studio Label Studio is a multi-type data labeling and annotation tool with standardized output format 项目地址: https://gitcode.com/GitHub_Trending/la/label-studio …

2026/5/24 13:20:49 阅读更多

深度解析ComfyUI-WanVideoWrapper：如何在ComfyUI中构建专业级AI视频生成工作流

深度解析ComfyUI-WanVideoWrapper：如何在ComfyUI中构建专业级AI视频生成工作流【免费下载链接】ComfyUI-WanVideoWrapper 项目地址: https://gitcode.com/GitHub_Trending/co/ComfyUI-WanVideoWrapper ComfyUI-WanVideoWrapper是一个为WanVideo系列模型设计…

2026/5/24 13:20:49 阅读更多

Cursor Pro工具完整指南：5步实现AI编程助手设备标识管理方案

Cursor Pro工具完整指南：5步实现AI编程助手设备标识管理方案【免费下载链接】cursor-free-vip [Support 0.45]（Multi Language 多语言）自动注册 Cursor Ai ，自动重置机器ID ， 免费升级使用Pro 功能: Youve reached yo…

2026/5/24 13:20:09 阅读更多

3步快速实现Android Studio完整汉化：告别英文困扰，提升开发效率

3步快速实现Android Studio完整汉化：告别英文困扰，提升开发效率【免费下载链接】AndroidStudioChineseLanguagePack AndroidStudio中文插件(官方修改版本） 项目地址: https://gitcode.com/gh_mirrors/an/AndroidStudioChineseLanguagePack…

2026/5/24 13:20:09 阅读更多

高效小红书数据采集完全指南：从入门到实战的完整解决方案

高效小红书数据采集完全指南：从入门到实战的完整解决方案【免费下载链接】xhs 基于小红书 Web 端进行的请求封装。https://reajason.github.io/xhs/ 项目地址: https://gitcode.com/gh_mirrors/xh/xhs 小红书数据采集已成为市场分析、品牌运营和内容创作的关…

2026/5/24 13:20:09 阅读更多

LLM智能体与蒙特卡洛树搜索融合：SELA框架如何革新AutoML

1. 项目概述：当LLM智能体遇上蒙特卡洛树搜索如果你也和我一样，常年混迹在数据科学和机器学习的一线，那你一定对AutoML（自动化机器学习）又爱又恨。爱的是，它承诺解放我们的双手，把我们从无穷无尽…

2026/5/24 13:19:48 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/24 0:01:12 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/24 0:01:32 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/24 0:02:33 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

2026/5/24 0:01:12 阅读更多

附录 B：术语表

2026/5/24 0:01:32 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

2026/5/24 0:02:33 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/23 15:04:07 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/23 12:38:32 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/24 9:50:45 阅读更多

相关文章

别再死记硬背NLL公式了！用PyTorch手把手带你复现一个分类任务（附完整代码）

保姆级教程：手把手教你用Vue 3 + TypeScript封装一个媲美Element UI的Slider滑块组件

油猴脚本进阶：如何精准拦截B站、知乎等特定网站的Fetch请求而不‘误伤’？

5分钟快速上手Label Studio：终极开源数据标注工具完整指南

深度解析ComfyUI-WanVideoWrapper：如何在ComfyUI中构建专业级AI视频生成工作流

Cursor Pro工具完整指南：5步实现AI编程助手设备标识管理方案

3步快速实现Android Studio完整汉化：告别英文困扰，提升开发效率

高效小红书数据采集完全指南：从入门到实战的完整解决方案

LLM智能体与蒙特卡洛树搜索融合：SELA框架如何革新AutoML

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

附录 B：术语表

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

附录 B：术语表

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥