python调用transformer示例、transformer规范等

发布时间：2026/5/25 18:04:32

文章目录安装依赖本地调用示例-基础版本地调用-pipeline简化版api调用(见openAI笔记)训练及保存(见其他笔记)AutoModelForCausalLMfrom_pretrained()from_pretrained()-最常用完整版代码带注释from_pretrained()-参数说明cpu环境代码cpu4bit量化(最快)gpu环境小技巧如何实现不匹配返回0让大模型不学习?其他文档transformer在人工智能中特别是深度学习这一块非常重要相当于人工智能的基石。这里只演示回答问题训练及保存见其他笔记。安装依赖pip install transformers peft accelerate torch datasets本地调用示例-基础版fromtransformersimportAutoTokenizer,AutoModelForCausalLMimporttorch# 1. 指定模型名称 (也可以替换为本地路径 ./my_local_model)model_nameQwen/Qwen2.5-7B-Instructprint(f正在加载模型:{model_name}...)# 2. 加载分词器 (Tokenizer) - 负责将文字转为数字tokenizerAutoTokenizer.from_pretrained(model_name,trust_remote_codeTrue)# 3. 加载模型权重 (Model) - 负责计算# device_mapauto 会自动检测并使用 GPU如果没有 GPU 则用 CPUmodelAutoModelForCausalLM.from_pretrained(model_name,torch_dtypetorch.float16,# 使用半精度节省显存device_mapauto,trust_remote_codeTrue)# 4. 准备输入数据 (构建 Prompt)messages[{role:system,content:你是一个有用的助手。},{role:user,content:请用一句话解释什么是远程过程调用 (RPC)。}]# 应用聊天模板 (Chat Template)将对话列表转换为模型能理解的文本格式texttokenizer.apply_chat_template(messages,tokenizeFalse,add_generation_promptTrue)model_inputstokenizer([text],return_tensorspt).to(model.device)print(正在生成回复...)# 5. 生成推理 (核心 API 调用)generated_idsmodel.generate(**model_inputs,max_new_tokens512,# 最大生成长度do_sampleTrue,# 开启采样使回答更自然temperature0.7,# 温度参数越高越随机top_p0.9# 核采样参数)# 6. 解码输出generated_ids[output_ids[len(input_ids):]forinput_ids,output_idsinzip(model_inputs.input_ids,generated_ids)]responsetokenizer.batch_decode(generated_ids,skip_special_tokensTrue)[0]print(\n--- 模型回复 ---)print(response)本地调用-pipeline简化版fromtransformersimportpipeline# 自动下载模型并创建管道 (本地运行)# tasktext-generation 告诉它我们要做什么generatorpipeline(text-generation,modelQwen/Qwen2.5-7B-Instruct)# 直接调用messages[{role:user,content:Python 和 Java 有什么区别}]responsegenerator(messages,max_new_tokens200)print(response[0][generated_text])api调用(见openAI笔记)略训练及保存(见其他笔记)略AutoModelForCausalLMfrom_pretrained()from_pretrained是预训练方法特别重要的一个方法。from_pretrained()-最常用完整版代码带注释modelAutoModelForCausalLM.from_pretrained(# 1. 模型名称或本地路径必填pretrained_model_name_or_pathQwen/Qwen2.5-1.5B-Instruct,# 2. 4bit 量化你现在最需要quantization_configbnb_config,# 3. 设备自动分配cpu / cudadevice_mapcpu,# 或 auto / cuda# 4. 降低CPU内存使用low_cpu_mem_usageTrue,# 5. 数据类型CPU必须用float32torch_dtypetorch.float32,# 6. 信任远程代码有些模型需要trust_remote_codeFalse,# 7. 不加载权重仅测试force_downloadFalse,)from_pretrained()-参数说明参数名类型说明示例pretrained_model_name_or_pathstr(必填) 模型名称或本地路径。1. Hugging Face ID:Qwen/Qwen2.5-1.5B-Instruct2. 本地路径:./models/qwen-1.5b3. 快照ID:Qwen/Qwen2.5-1.5B-Instruct/snapshot/abc123Qwen/Qwen2.5-1.5B-Instructdevice_mapstr/dict设备映射策略。-auto: 自动分配 (优先 GPU不够放 CPU/磁盘)。-cuda:0: 强制全量放在第一张显卡。-cpu: 强制放在 CPU。-{: cpu}: 显式指定。GTX 850M:cuda:0(配合max_memory)纯 CPU:cpumax_memorydict限制每张卡/CPU 的最大显存/内存使用量。格式{设备ID: 容量字符串}。防止占满显存导致系统卡死。GTX 850M:{0: 1800MiB}(留余量给系统)CPU: 通常不设或设{ cpu: 10GiB }offload_folderstr当显存/内存不足时将部分权重卸载到硬盘的文件夹路径。需配合device_mapauto使用。如果 2G 显存实在不够可设./offload但速度会极慢。quantization_configBitsAndBytesConfig4-bit/8-bit 量化配置对象。这是加载 4-bit 模型的唯一入口。必须传入由BitsAndBytesConfig初始化的对象。quantization_configbnb_config(必传)torch_dtype/dtypetorch.dtype/str加载权重的数据类型。-torch.float16: 半精度 (省显存GPU 常用)。-torch.bfloat16: BF16 (新显卡常用)。-torch.float32: 全精度 (CPU 常用稳定)。注新版推荐用dtype旧版用torch_dtype。GPU:torch.float16CPU:torch.float32low_cpu_mem_usagebool低 CPU 内存模式。True: 避免在加载过程中将完整模型载入 CPU 内存直接分片加载到目标设备。加载大模型时建议始终开启。True(推荐防止加载瞬间爆内存)trust_remote_codebool是否信任远程代码。许多国产模型 (如 Qwen, ChatGLM) 包含自定义的 Python 代码 (modeling_xxx.py)。设为True才能加载这些模型。Qwen 系列必须设为Truerevisionstr指定加载模型的特定分支、Tag 或 Commit Hash。用于复现特定版本或测试未合并的模型。默认maincache_dirstr自定义模型缓存下载目录。默认在~/.cache/huggingface。—force_downloadbool强制重新下载模型忽略本地缓存。—resume_downloadbool允许断点续传 (新版本默认开启)。—local_files_onlybool只读取本地文件不尝试联网。联网失败时很有用。—use_safetensorsbool是否优先加载.safetensors格式 (更安全、加载更快)。默认True。—cpu环境代码modelAutoModelForCausalLM.from_pretrained(Qwen/Qwen2.5-1.5B-Instruct,device_mapcpu,low_cpu_mem_usageTrue,torch_dtypetorch.float32,)cpu4bit量化(最快)modelAutoModelForCausalLM.from_pretrained(Qwen/Qwen2.5-1.5B-Instruct,quantization_configbnb_config,device_mapcpu,low_cpu_mem_usageTrue,torch_dtypetorch.float32,)gpu环境modelAutoModelForCausalLM.from_pretrained(Qwen/Qwen2.5-1.5B-Instruct,device_mapauto,torch_dtypetorch.float16,)小技巧如何实现不匹配返回0让大模型不学习?labels设为-100。# 【核心技巧】如何实现“不匹配则是0”# 在 Transformers 中将 labels 设为 -100计算 Loss 时会自动忽略该位置iftag1:# 匹配保留原始 ID 作为 label模型会学习labels_list.append(ids)else:# 不匹配全部填 -100模型看见但不学习 (Loss0)labels_list.append([-100]*len(ids))其他文档github transformer git地址(还可以吧比hugging face访问成功率高些)https://github.com/huggingface/transformers

智能车竞赛中的AI视觉：Z-Image-Turbo生成训练数据增强方案

智能车竞赛中的AI视觉：Z-Image-Turbo生成训练数据增强方案参加智能车竞赛的朋友们，肯定都遇到过这样的难题：辛辛苦苦采集了几百张赛道图片，训练出来的模型，一到赛场上光线稍微一变，或者换个背景&#xff…

2026/5/25 18:02:15 阅读更多

收藏！腾讯AI产品经理总年薪85.5万曝光，小白/程序员入门参考必看

对于想切入AI赛道的小白、程序员来说，AI产品经理绝对是高性价比选择——近日，一位行业老哥公开分享了自己的任职信息，腾讯大厂加持、AI产品经理岗位、职级达到P10，总年薪直接拉满至85.5万，这样的薪资水平，说…

2026/5/25 2:28:39 阅读更多

ssm+java2026年毕设书憩廊在线图书管理系统【源码+论文】

本系统（程序源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容一、选题背景关于图书管理系统的研究，现有研究主要以传统单机版图书管理软件或基于C/S架构的管理系统为主，专门针对…

2026/5/25 15:16:01 阅读更多

深度解析：JetBrains IDE试用期重置机制的技术实现

深度解析：JetBrains IDE试用期重置机制的技术实现【免费下载链接】ide-eval-resetter 项目地址: https://gitcode.com/gh_mirrors/id/ide-eval-resetter 在软件开发工作流中，JetBrains IDE试用期管理是一个常见的技术挑战，尤其是在多…

2026/5/25 18:03:24 阅读更多

BHQ2-NHS 黑洞淬灭剂2-活性酯 CAS：916753-62-3 制备过程

下面是xi an 瑞.禧.小编整理的BHQ2-酸（BHQ-2-COOH）转化为其 NHS 酯（BHQ2-NHS） 的常用合成路线、机理示意、实验要点、纯化/表征方法与常见问题与解决建议。一、合成思路核心反应常用耦合体系EDCHCl NHS（水溶/DMF 条件…

2026/5/25 18:03:03 阅读更多

SteamDB数据提取神器：Get Data from Steam / SteamDB插件安装与使用详解

SteamDB数据提取神器：Get Data from Steam / SteamDB插件安装与使用详解【免费下载链接】GetDataFromSteam-SteamDB 项目地址: https://gitcode.com/gh_mirrors/ge/GetDataFromSteam-SteamDB Get Data from Steam / SteamDB（曾用名Get DLC Info…

2026/5/25 18:02:23 阅读更多

正视孩童情绪波动，耐心陪伴平稳疏导

孩子的情绪就像夏天的天气，前一秒还晴空万里，后一秒可能就乌云密布。面对突如其来的哭闹、发脾气或者闷闷不乐，很多家长会急着“灭火”——要么讲道理，要么直接制止。但其实，情绪波动本身不是问题，它是孩子…

2026/5/25 18:01:22 阅读更多

交流电方向检测原理与实验：从相位差到光伏并网计量

1. 项目概述：交流电方向检测的实践意义如果你家里装了光伏系统，或者对家庭能源管理感兴趣，那你肯定遇到过这个问题：电表怎么知道现在是电网在给你家供电，还是你家多余的光伏电在往电网里“倒灌”？这背后其实…

2026/5/25 18:01:02 阅读更多

Taotoken用量看板功能详解，助你洞察团队AI资源消耗模式

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度 Taotoken用量看板功能详解，助你洞察团队AI资源消耗模式对于技术管理者或项目负责人而言，清晰了解团队的AI…

2026/5/25 18:00:01 阅读更多

Go语言SQLite轻量级数据库应用

Go语言SQLite轻量级数据库应用引言 SQLite是一款轻量级的嵌入式数据库，无需独立服务进程，非常适合单机应用、移动端应用和开发测试环境。Go语言通过database/sql包配合go-sqlite3驱动可以方便地操作SQLite数据库。本文将深入探讨Go语言中SQLite的使用技…

2026/5/25 0:01:30 阅读更多

【前端无障碍】屏幕阅读器兼容性：确保视障用户的良好体验

【前端无障碍】屏幕阅读器兼容性：确保视障用户的良好体验前言大家好，我是cannonmonster01！今天咱们来聊聊屏幕阅读器兼容性这个话题。想象一下，一个视障用户打开你的网站，通过屏幕阅读器来浏览内容。如果你的网站没有…

2026/5/25 0:02:31 阅读更多

2026年横评10款降AI率软件:只选真正管用的那一款！

随着AI写作工具的广泛应用，论文写作和内容创作效率得到了显著提升，许多学生和职场人士都开始依赖这些工具来完成繁重的文字任务。然而，随着各大高校、期刊平台对AIGC内容检测技术的不断升级，AI生成内容的痕迹越来越容易被识别。不…

2026/5/25 0:04:13 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/25 1:05:07 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/25 1:05:13 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/25 1:05:14 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/25 15:34:05 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/25 15:07:25 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/25 11:05:00 阅读更多

相关文章