新手必看!MindSpeed-LLM跑通Qwen3-1.7B的5个关键步骤 新手必看MindSpeed-LLM跑通Qwen3-1.7B的5个关键步骤【免费下载链接】Qwen3-1.7B项目地址: https://ai.gitcode.com/hf_mirrors/MindSpeed/Qwen3-1.7BQwen3是阿里云于2025年4月28日发布的新一代大型语言模型提供了从0.6B到235B的多种尺寸。MindSpeed-LLM作为昇腾AI生态的重要技术支撑在Qwen3发布当天就实现了对Qwen3-1.7B模型的完美支持为开发者提供了稳定高效的部署平台。本文将介绍新手如何通过5个关键步骤在MindSpeed-LLM上成功跑通Qwen3-1.7B模型。一、环境配置打造适配昇腾NPU的运行环境MindSpeed-LLM需要特定的软硬件环境支持确保Qwen3-1.7B模型能够高效运行。1.1 硬件要求Qwen3-1.7B模型的全参微调需要8 x Ascend NPUs的硬件配置推荐使用昇腾A2单机8卡环境进行训练和推理。1.2 软件依赖主要依赖软件及版本要求如下昇腾NPU驱动、固件商发版本CANN Toolkit、Kernel、NNAL商发版本Python3.10PyTorch2.1.0torch_npu插件2.1.0apex商发版本transformers4.51.3需特别指定1.3 仓库部署首先拉取必要的代码仓库git clone https://gitcode.com/hf_mirrors/MindSpeed/Qwen3-1.7B git clone https://github.com/NVIDIA/Megatron-LM.git cd Megatron-LM git checkout core_r0.8.0 cp -r megatron ../MindSpeed-LLM/ cd .. cd MindSpeed-LLM mkdir logs mkdir dataset mkdir ckpt然后创建并配置conda环境conda create -n test python3.10 conda activate test pip install torch-2.1.0-cp310-cp310m-manylinux2014_aarch64.whl pip install torch_npu-2.1.0*-cp310-cp310m-linux_aarch64.whl git clone https://gitee.com/ascend/MindSpeed.git cd MindSpeed git checkout 2c085cc9 pip install -r requirements.txt pip3 install -e . cd ../MindSpeed-LLM pip install -r requirements.txt pip install transformers 4.51.3二、权重转换将开源权重转为MindSpeed格式2.1 权重下载从HuggingFace或魔乐社区下载Qwen3-1.7B的权重和配置文件HuggingFacehttps://huggingface.co/Qwen/Qwen3-1.7B魔乐社区https://modelers.cn/models/Models_Ecosystem/Qwen3-1.7B2.2 执行转换脚本MindSpeed-LLM提供专用脚本将HuggingFace格式权重转换为mcore格式cd MindSpeed-LLM bash tests/0day/qwen3/qwen3-1.7b/ckpt_convert_qwen3_1point7b_hf2mcore.sh请根据实际需要的TP/PP等切分策略和权重路径修改脚本参数。三、数据预处理为模型训练准备高质量数据MindSpeed-LLM提供数据预处理脚本帮助开发者快速准备训练数据cd MindSpeed-LLM bash tests/0day/qwen3/qwen3-1.7b/data_convert_qwen3_1point7b_pretrain.sh关键参数说明 | 参数名 | 含义 | |--------|------| | --input | 数据集路径 | | --tokenizer-name-or-path | 模型tokenizer目录 | | --output-prefix | 输出路径及前缀名 |四、模型训练启动Qwen3-1.7B的训练过程完成数据准备后即可启动模型训练cd MindSpeed-LLM bash tests/0day/qwen3/qwen3-1.7b/pretrain_qwen3_1point7b_ptd.sh需要根据实际情况修改的关键变量 | 变量名 | 含义 | |--------|------| | MASTER_ADDR | 多机情况下主节点IP | | NODE_RANK | 多机下各机节点序号 | | CKPT_SAVE_DIR | 训练权重保存路径 | | DATA_PATH | 预处理后的数据路径 | | TOKENIZER_PATH | qwen3 tokenizer目录 | | CKPT_LOAD_DIR | 初始权重路径 |五、推理验证测试Qwen3-1.7B模型效果训练完成后可通过以下命令进行推理测试cd MindSpeed-LLM bash tests/0day/qwen3/qwen3-1.7b/generate_qwen3_1point7b_ptd.sh推理脚本主要变量 | 变量名 | 含义 | |--------|------| | MASTER_ADDR | 多机主节点IP | | NODE_RANK | 节点序号 | | CHECKPOINT | 训练保存的权重路径 | | TOKENIZER_PATH | qwen3 tokenizer目录 |通过以上5个关键步骤新手也能顺利在MindSpeed-LLM上跑通Qwen3-1.7B模型。MindSpeed-LLM与昇腾芯片的深度集成确保了模型的高效运行而简洁的脚本化流程大大降低了部署难度帮助开发者快速将Qwen3-1.7B应用到实际项目中。【免费下载链接】Qwen3-1.7B项目地址: https://ai.gitcode.com/hf_mirrors/MindSpeed/Qwen3-1.7B创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考