Hugging Face下载模型本地调用

发布时间：2026/6/28 10:34:46

注册账号首先登陆Hugging Face官网https://huggingface.co/ 访问时候需要使用代理base使用美国。安装Hugging Face库使用的系统(base)➜ ~ lsb_release-aNo LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu26.04LTS Release:26.04Codename: resolute基础环境搭建安装miniconda可以参考https://juejin.cn/post/7601076815450030095创建虚拟环境conda create-nhugging_facepython3.12conda activate hugging_face安装包安装CUDAcuDNN和PyTorchpip3installtorch torchvision安装Hugging Face核心组件 transformers datasets tokenizerspip3installtransformers datasets tokenizers这三个库是 Hugging Face 生态系统中用于自然语言处理NLP和大语言模型LLM开发的核心组件。它们各自分工明确通常配合使用。transformers核心模型库这是 Hugging Face 提供的一个强大的开源 Python 库为文本、计算机视觉、音频等多模态领域的顶尖机器学习模型提供了统一的定义框架。主要功能包含了数千个预训练模型如 BERT、GPT、T5 等并提供了一套简单易用的 API如Pipeline和Trainer方便开发者快速进行文本分类、机器翻译、文本生成、问答系统等任务的推理和微调训练。特点支持跨框架兼容如 PyTorch、TensorFlow极大地简化了与复杂自然语言处理模型交互的工作流程。datasets数据集管理库这个库主要用于简化数据集的加载、处理和版本管理是机器学习和数据科学项目中不可或缺的工具。主要功能允许用户通过简单的 API 轻松访问和下载大量开源的标准数据集。同时也支持加载和处理自定义数据集如文本、图像、音频和表格数据。特点提供了高效的数据处理、内存映射、版本控制以及数据隐私保护如匿名化等功能能够无缝对接transformers库进行模型训练和评估。tokenizers分词器库Tokenizers 是自然语言处理NLP流程中至关重要的第一步负责将人类可读的文本拆分成机器可以理解的、有意义的单元即 Token。主要功能在大语言模型LLM的流水线中分词器是一个完全独立的阶段。它通过特定的算法如 BPE 字节对编码将字符串编码为 Token ID 序列或者将 Token ID 解码回字符串。特点专为 Transformer 模型设计支持子词分词方法能够高效处理大型词汇表和罕见词汇。分词器的质量直接影响模型对上下文的理解、多语言处理以及算术等任务的表现。本地下载模型在前面我们创建的环境中运行如下脚本importos# 将 http://192.168.0.52:7897 替换为您实际的代理服务器地址和端口os.environ[HTTP_PROXY]http://192.168.0.52:7897os.environ[HTTPS_PROXY]http://192.168.0.52:7897fromtransformersimportAutoModelForCausalLM,AutoTokenizer# 将模型和分词器下载到本地指定保存路径model_nameQwen/Qwen3.5-0.8Bmodel_download_dir/home/gillbert/code/hugging_face_test/model# 放到当前项目的model目录下# 下载模型AutoModelForCausalLM.from_pretrained(model_name,cache_dirmodel_download_dir)# 下载分词工具AutoTokenizer.from_pretrained(model_name,cache_dirmodel_download_dir,trust_remote_codeTrue,device_mapauto)print(下载完成)(hugging_face)➜ hugging_face_test git:(master)✗lsREADME.md main.py model pyproject.toml(hugging_face)➜ hugging_face_test git:(master)✗ python3 main.py本地调用模型importtorchfromtransformersimportAutoModelForCausalLM,AutoTokenizer# 1. 配置模型路径替换为您本地实际的模型路径或名称config.json在哪个目录写到哪里model_name/home/gillbert/code/hugging_face_test/model/models--Qwen--Qwen3.5-0.8B/snapshots/2fc06364715b967f1860aea9cf38778875588b17# 2. 加载分词器和模型# trust_remote_codeTrue 是 Qwen 系列必需的用于加载自定义分词逻辑print(正在加载模型...)tokenizerAutoTokenizer.from_pretrained(model_name,trust_remote_codeTrue)modelAutoModelForCausalLM.from_pretrained(model_name,trust_remote_codeTrue,device_mapauto,# 自动分配 CPU/GPUtorch_dtypeauto# 自动选择精度如 float16以节省显存)model.eval()# 切换到推理模式print(模型加载完成)# 3. 定义对话生成函数defchat_with_qwen(user_input):# 构建 Qwen 模型要求的对话格式promptf|im_start|user\n{user_input}|im_end|\n|im_start|assistant\n# 将文字转换为模型可识别的张量inputstokenizer(prompt,return_tensorspt).to(model.device)# 模型推理关闭梯度计算以提升速度、降低内存占用withtorch.no_grad():outputsmodel.generate(**inputs,max_new_tokens512,# 控制回答的最大长度temperature0.7,# 控制回答的随机性0-1之间值越大越有创意top_p0.8,# 核采样控制输出词汇的多样性do_sampleTrue# 开启采样让回答更自然)# 将模型输出的数字张量解码为人类可读的文字responsetokenizer.decode(outputs[0],skip_special_tokensTrue)# 截取模型生成的答案去除输入提示词只保留输出answerresponse.replace(prompt,).strip()returnanswer# 4. 开启多轮对话测试if__name____main__:whileTrue:user_inputinput(\n你: )ifuser_input.lower()in[exit,quit,退出]:print(对话结束。)breakresponsechat_with_qwen(user_input)print(fQwen:{response})遇到的问题使用脚本下载时候下载一半停了再运行脚本无法下载了此时需要清除下之前下载的模型缓存rm-rf~/.cache/huggingface/hub/models--Qwen--Qwen3.5-0.8B参考文章https://pytorch.org/get-started/locally/

TV Bro浏览器终极指南：一键解锁智能电视的完整上网体验

TV Bro浏览器终极指南：一键解锁智能电视的完整上网体验【免费下载链接】tv-bro Simple web browser for android optimized to use with TV remote 项目地址: https://gitcode.com/gh_mirrors/tv/tv-bro TV Bro是一款专为智能电视和Android电视盒优化的开源…

2026/6/28 10:33:26 阅读更多

所有文章目录

一、基于ESP32-E的小车二、基于STM32F103的遥控器

2026/6/28 10:33:05 阅读更多

从零搭建智能文档中枢：基于大语言模型的文档自动处理与问答系统

引言在企业数字化转型浪潮中，大量非结构化文档（合同、报告、手册、邮件）成为沉睡的数据资产。传统关键词搜索效率低、语义理解弱，而大语言模型（LLM）虽然知识渊博，却无法直接访问企业内部文档&a…

2026/6/28 10:31:45 阅读更多

服饰服装宣传系统源码 Java+SpringBoot+Vue 前后分离

一、关键词服饰宣传系统，服装宣传体系，服饰品牌传播系统二、作品包含源码数据库全套环境和工具资源本地部署教程三、项目技术前端技术：Html、Css、Js、Vue2.0、Element-ui后端技术：Java、SpringBoot2.0、MyBatis四、运行环境&…

2026/6/28 11:57:45 阅读更多

天星账号保管箱：开发者的全能SSH密钥与数字资产守护者

在数字化转型的浪潮下，开发者的服务器资源管理早已不再局限于简单的SSH远程连接。面对服务器集群、云端基础设施以及繁杂的身份验证机制，如何在高效率与高安全性之间找到平衡点，成为了每一位运维和开发人员的痛点。天星账号保管箱&#xff08…

2026/6/28 11:57:05 阅读更多

【软考含金量权威报告】：2024年工信部/人社部数据揭秘：哪3类证书薪资涨幅超37%？

更多请点击： https://kaifayun.com 第一章：软考证书含金量的定义与评估维度软考（计算机技术与软件专业技术资格（水平）考试）证书的含金量，并非单一指标所能概括，而是由政策认可度、…

2026/6/28 11:56:45 阅读更多

【软考通关率暴涨37%的底层逻辑】：20年阅卷专家首次公开命题陷阱与应试心法

更多请点击： https://kaifayun.com 第一章：软考通关率暴涨37%的底层逻辑真相近年来，全国计算机技术与软件专业技术资格（水平）考试（简称“软考”）整体通过率较三年前提升37%，但这一…

2026/6/28 11:56:45 阅读更多

暗黑破坏神2存档编辑器终极指南：可视化修改角色与装备的实战秘籍

暗黑破坏神2存档编辑器终极指南：可视化修改角色与装备的实战秘籍【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 你是否曾为暗黑破坏神2中某个角色的属性点分配不当而懊恼？是否梦想过拥有完美的装备组合来…

2026/6/28 11:56:25 阅读更多

3步永久保存B站缓存视频：高效开源m4s转换工具完全指南

3步永久保存B站缓存视频：高效开源m4s转换工具完全指南【免费下载链接】m4s-converter 一个跨平台小工具，将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 你是否曾遇到过这样的情况&…

2026/6/28 11:55:04 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:00:03 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/6/28 1:01:08 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:02:09 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

2026/6/28 0:00:03 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:01:08 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:02:09 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/27 12:47:04 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/27 13:25:14 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/27 13:25:16 阅读更多

相关文章

TV Bro浏览器终极指南：一键解锁智能电视的完整上网体验

所有文章目录

从零搭建智能文档中枢：基于大语言模型的文档自动处理与问答系统

服饰服装宣传系统源码 Java+SpringBoot+Vue 前后分离

天星账号保管箱：开发者的全能SSH密钥与数字资产守护者

【软考含金量权威报告】：2024年工信部/人社部数据揭秘：哪3类证书薪资涨幅超37%？

【软考通关率暴涨37%的底层逻辑】：20年阅卷专家首次公开命题陷阱与应试心法

暗黑破坏神2存档编辑器终极指南：可视化修改角色与装备的实战秘籍

3步永久保存B站缓存视频：高效开源m4s转换工具完全指南

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因