一、套件功能分层模块化覆盖大模型全生命周期MindSpore Transformers通过“任务组件模块组件特性组件” 三层架构实现大模型开发的全流程支撑任务组件MindFormers任务组件分为PIPELINE预置SOTA下游任务支持快速推理体验和TRAINER预置SOTA预训练及下游任务支持训练/微调/评估/推理全流程能力让开发者无需重复造轮子直接复用成熟任务模板。模块组件MindFormers模块组件包含配置组件化模块化配置降低参数管理复杂度与网络组件化模块化组网灵活拼接模型结构支持开发者“搭积木式”定制模型架构兼顾灵活性与原有效率。特性组件MindFormers特性组件提供恢复训练、边训边评估、增量式基础训练、集群性能分析、LoRA微调等核心特性还支持权重自动下载及加载、数据集自动下载、AIC计算中心等便捷功能以及多维混合并行流水线、张量、序列、优化器、混合并行、多维存储优化内存、重计算、CPU Offload、NVMe Offload 等进阶能力大幅提升大模型训练的效率与稳定性。二、支持任务与模型多领域覆盖适配多元场景套件覆盖NLP、CV、多模态三大领域支持10主流任务、10 SOTA模型适配丰富的下游场景NLP领域预训练任务Masked Language ModelingMLM如Bert、Causal Language ModelingCLM如Bloom/Llama/GLM/GPT/Pangu、Translation如T5下游任务文本生成、文本分类、问答、序列标注、填词、文本生成/翻译/问答等覆盖自然语言处理核心场景。CV领域预训练任务Masked Image ModelingMIM如MAE_Vit、SimMIM_Swin、Image Classification如Vit、Swin、SAM、Image Segmentation如SAM、Contrastive Language-Image Pretraining如Clip、BLIP-2下游任务图像分类、图像分割、零样本图像分类等支撑计算机视觉核心需求。多模态领域支持对比语言-图像预训练如Clip、BLIP-2赋能图文跨模态理解与生成。三、用户使用开箱即用便捷开发套件为用户提供“安装→开发→任务创建” 的极简流程降低大模型开发门槛安装方式支持clone mindformers仓库或pip install mindformers开箱即用网络组件开发用户可自定义开发optimizer、loss、models等模块灵活扩展模型能力任务创建通过统一的Trainer或pipeline可快速创建“训练、微调、评估、推理”任务无需关注底层细节。套件基于CANN昇腾计算架构 MindSpore华为自研AI框架 构建深度优化昇腾硬件算力支持“云-边-端”多场景部署为大模型训练与推理提供强劲性能支撑。MindSpore Transformers大模型套件以“全流程覆盖、多模态支持、便捷化开发”为核心结合昇腾硬件与MindSpore框架的技术优势让大模型开发从“科研难题”变为“工程实践”加速AI技术在各行业的落地应用。
MindSpore Transformers大模型套件
发布时间:2026/5/15 22:34:20
一、套件功能分层模块化覆盖大模型全生命周期MindSpore Transformers通过“任务组件模块组件特性组件” 三层架构实现大模型开发的全流程支撑任务组件MindFormers任务组件分为PIPELINE预置SOTA下游任务支持快速推理体验和TRAINER预置SOTA预训练及下游任务支持训练/微调/评估/推理全流程能力让开发者无需重复造轮子直接复用成熟任务模板。模块组件MindFormers模块组件包含配置组件化模块化配置降低参数管理复杂度与网络组件化模块化组网灵活拼接模型结构支持开发者“搭积木式”定制模型架构兼顾灵活性与原有效率。特性组件MindFormers特性组件提供恢复训练、边训边评估、增量式基础训练、集群性能分析、LoRA微调等核心特性还支持权重自动下载及加载、数据集自动下载、AIC计算中心等便捷功能以及多维混合并行流水线、张量、序列、优化器、混合并行、多维存储优化内存、重计算、CPU Offload、NVMe Offload 等进阶能力大幅提升大模型训练的效率与稳定性。二、支持任务与模型多领域覆盖适配多元场景套件覆盖NLP、CV、多模态三大领域支持10主流任务、10 SOTA模型适配丰富的下游场景NLP领域预训练任务Masked Language ModelingMLM如Bert、Causal Language ModelingCLM如Bloom/Llama/GLM/GPT/Pangu、Translation如T5下游任务文本生成、文本分类、问答、序列标注、填词、文本生成/翻译/问答等覆盖自然语言处理核心场景。CV领域预训练任务Masked Image ModelingMIM如MAE_Vit、SimMIM_Swin、Image Classification如Vit、Swin、SAM、Image Segmentation如SAM、Contrastive Language-Image Pretraining如Clip、BLIP-2下游任务图像分类、图像分割、零样本图像分类等支撑计算机视觉核心需求。多模态领域支持对比语言-图像预训练如Clip、BLIP-2赋能图文跨模态理解与生成。三、用户使用开箱即用便捷开发套件为用户提供“安装→开发→任务创建” 的极简流程降低大模型开发门槛安装方式支持clone mindformers仓库或pip install mindformers开箱即用网络组件开发用户可自定义开发optimizer、loss、models等模块灵活扩展模型能力任务创建通过统一的Trainer或pipeline可快速创建“训练、微调、评估、推理”任务无需关注底层细节。套件基于CANN昇腾计算架构 MindSpore华为自研AI框架 构建深度优化昇腾硬件算力支持“云-边-端”多场景部署为大模型训练与推理提供强劲性能支撑。MindSpore Transformers大模型套件以“全流程覆盖、多模态支持、便捷化开发”为核心结合昇腾硬件与MindSpore框架的技术优势让大模型开发从“科研难题”变为“工程实践”加速AI技术在各行业的落地应用。