from awq import AutoAWQForCausalLMfrom transformers import AutoTokenizermodel_path ./Qwen3.6-27B # 替换为你下载的原始模型路径quant_path ./models/Qwen3.6-27B-AWQ-Local# 1. 加载模型与分词器model AutoAWQForCausalLM.from_pretrained(model_path, trust_remote_codeTrue)tokenizer AutoTokenizer.from_pretrained(model_path, trust_remote_codeTrue)# 2. 配置 AWQ 量化参数quant_config {zero_point: True,q_group_size: 128,w_bit: 4,version: GEMM}# 3. 执行量化这一步极度消耗内存请盯紧系统资源print(开始本地量化请耐心等待...)model.quantize(tokenizer, quant_configquant_config)# 4. 保存量化后的模型print(保存量化模型中...)model.save_quantized(quant_path)tokenizer.save_pretrained(quant_path)print(本地量化完成)
大模型量化-rr
from awq import AutoAWQForCausalLMfrom transformers import AutoTokenizermodel_path ./Qwen3.6-27B # 替换为你下载的原始模型路径quant_path ./models/Qwen3.6-27B-AWQ-Local# 1. 加载模型与分词器model AutoAWQForCausalLM.from_pretrained(model_path, trust_remote_codeTrue)tokenizer AutoTokenizer.from_pretrained(model_path, trust_remote_codeTrue)# 2. 配置 AWQ 量化参数quant_config {zero_point: True,q_group_size: 128,w_bit: 4,version: GEMM}# 3. 执行量化这一步极度消耗内存请盯紧系统资源print(开始本地量化请耐心等待...)model.quantize(tokenizer, quant_configquant_config)# 4. 保存量化后的模型print(保存量化模型中...)model.save_quantized(quant_path)tokenizer.save_pretrained(quant_path)print(本地量化完成)
相关文章
职场人迈入 35 岁别再盲目内卷!提前做好职业长期布局规划,避开中年危机实现稳步增值
作为网络安全从业者,行业内一直流传着35岁的传论,那么大龄安全工程师该如何跨过这道坎?我离35岁也不远了,思考后和大家一起聊一聊~ 从目前我接触到的同事,他们的发展大概分为这三条路: 一、钻研技术&…
2026大厂Java岗面试总结(八股/场景/项目/AI全覆盖,附答案)| 建议收藏
很多Java工程师的技术不错,但是一面试就头疼,10次面试9次都是被刷,过的那次还是去了家不知名的小公司。 问题就在于:面试有技巧,而你不会把自己的能力表达给面试官。 应届生:你该如何准备简历,…
Docker 的主要组件
安装 docker ,其实是安装了 docker 客户端、dockerd 等一系列的组件,其中比较重要的有下面几个。 Docker CLI(docker) docker 程序是一个客户端工具,用来把用户的请求发送给 docker daemon(dockerd)。该程序的安装路径为: /usr/…
msvcp140.dll丢失的解决方法?分层级精准修复方案(适配Win10/11全版本)
使用电脑打开游戏、设计软件、办公工具时,很多人会遇到“无法启动程序,计算机中丢失msvcp140.dll”的报错,程序瞬间闪退、无法运行。多数用户会盲目下载DLL文件粘贴替换,不仅大概率修复失败,还容易植入捆绑病毒、造成系…
Postman便携版:5分钟实现Windows绿色免安装API测试创新方案
Postman便携版:5分钟实现Windows绿色免安装API测试创新方案 【免费下载链接】postman-portable 🚀 Postman portable for Windows 项目地址: https://gitcode.com/gh_mirrors/po/postman-portable Postman便携版是一款专为Windows平台设计的绿色免…
利用AI助手高效解决IBM MQ AMQ8242E密码套件配置错误
1. 项目概述:当IBM MQ遇上AMQ8242E 如果你正在部署或维护一个基于IBM MQ的消息中间件环境,并且计划启用TLS/SSL加密来保障通道通信安全,那么你极有可能在某个深夜,于队列管理器错误日志里,与这个令人头疼的错误码不期而…
网站排序算法优化怎么做?(保姆级教程)
今天这篇文章,我就手把手带你从最简单的基础规则,一路做到基于机器学习的智能排序。全程保姆级,代码、公式、评估方法都给到你,读完可以直接落地。 一、先搞清楚:排序到底在解决什么问题? 无论是搜索引擎、…
完整指南:使用macOS Catalina Patcher让老旧Mac焕发新生
完整指南:使用macOS Catalina Patcher让老旧Mac焕发新生 【免费下载链接】macos-catalina-patcher macOS Catalina Patcher (http://dosdude1.com/catalina) 项目地址: https://gitcode.com/gh_mirrors/ma/macos-catalina-patcher macOS Catalina Patcher是一…
别再当盲盒用了!个微接口深度集成:把群聊碎语洗成 AI 一眼看懂的
在搭建大模型本地知识库(RAG)或者做 AI 搜索优化(GEO)的时候,很多朋友都通过个微接口,把私聊、技术群里的海量客户反馈成功接到了自己的后台。但这之后,大家往往会遇到一个非常折磨人的大坑&…
Selenium元素定位全解析:从八大方法到实战策略
1. 项目概述:从“找东西”到“精准操控” 做自动化测试,尤其是Web UI自动化,最核心也最让人头疼的一步是什么?不是写复杂的业务逻辑,也不是处理异步加载,而是最基础的—— 让程序找到页面上那个你想操作的…
移动端UI自动化测试框架Maestro终极指南:从入门到实战
1. 项目概述:为什么是Maestro? 如果你正在寻找一个能让你快速上手、告别繁琐配置、并且对移动端UI自动化测试真正友好的框架,那么Maestro很可能就是你一直在等的那个答案。我接触过Appium、Espresso、XCUITest,也折腾过各种基于图…
BurpSuite Cluster Bomb模式深度避坑指南:从原理到实战的完整爆破策略
1. 项目概述:从“能用”到“精通”的必经之路如果你正在学习或从事网络安全测试,尤其是Web应用安全评估,那么BurpSuite的Intruder模块绝对是你绕不开的核心工具。而Intruder模块里,功能最强大、也最让人又爱又恨的,莫过…
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告
6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…
华为OD机试2025C卷-字符统计及重排[100分]( Java _ Python3 _ C++ _ C语言 _ JsNode _ Go)实现100%通过率
📫 个人主页:深夜coding算法 📣 专栏系列:2026年华为最新OD机试题库详解 🔥 一次订阅,永久解锁 | 持续更新100篇 | 6语言全覆盖 文章目录❄️前言:☀️一:题目描述🌙 题目…
华为OD机试2025C卷-寻找相同子串[100分]( Java _ Python3 _ C++ _ C语言 _ JsNode _ Go)实现100%通过率
📫 个人主页:深夜coding算法 📣 专栏系列:2026年华为最新OD机试题库详解 🔥 一次订阅,永久解锁 | 持续更新100篇 | 6语言全覆盖 文章目录❄️前言:☀️一:题目描述🌙 题目…
FAE放射组学分析工具:医学影像特征探索的完整解决方案
FAE放射组学分析工具:医学影像特征探索的完整解决方案 【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE 你是否曾经面对海量医学影像数据感到无从下手?想要从CT、MRI等影像中提取有价值的定量特征&#…
0.69B参数实现中文多模态AI:揭秘Qwen3-SmVL模型融合技术的完整实战指南
0.69B参数实现中文多模态AI:揭秘Qwen3-SmVL模型融合技术的完整实战指南 【免费下载链接】happy-llm 📚 从零开始构建大模型 项目地址: https://gitcode.com/GitHub_Trending/ha/happy-llm 还在为大型多模态模型动辄数十亿参数、显存占用高而烦恼&…
解锁AMD Ryzen处理器性能潜力的SMU调试神器:从新手到专家的完整指南
解锁AMD Ryzen处理器性能潜力的SMU调试神器:从新手到专家的完整指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址…