CANN / ops-cv 量化介绍

发布时间：2026/7/5 3:59:11

量化介绍【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv量化广泛应用于深度学习模型中特别是在推理过程中。通过量化模型可以在硬件上更高效地运行减少计算资源的消耗和加速推理过程同时降低模型的存储需求。CANN算子量化是指对神经网络中Matmul等矩阵cube类算子的输入Tensor从高bit到低bit转换的计算过程同时生成对应的量化参数scale。当低bit的cube计算完成后可通过量化参数scale将低bit数值转换回高bit数值从而保证整体计算结果的正确性效果与直接用高bit计算近似等价并有效提升计算效率。静态量化使用预先确定的量化参数进行量化。推理场景下对权重weight的量化一般采用静态量化量化算子性能会更好些。动态量化使用输入数据在线计算量化参数进行量化。推理场景下对激活activation的量化一般采用动态量化更能适应数据的变化精度更高训练场景下为了提升量化精度也一般采用动态量化。注意动态量化因为在线生成量化参数量化算子性能会略差些。量化模式量化模式又称量化粒度是指对算子的不同输入Tensor采用不同的量化计算级别常见的量化计算模式包括说明m、n、k变量分别表示Tensor计算的不同轴大小。左矩阵、右矩阵分别指cube算子中用于矩阵乘法计算的两个输入Tensor一般左矩阵代表激活activation、右矩阵代表权重weight请用户按实际情况理解和使用。pertensor量化简称T量化量化对象既可以是左矩阵也可以是右矩阵每个Tensor共用一个相同的量化参数。假设左矩阵shape为(m, k)右矩阵shape为(k, n)k为reduce轴生成量化参数的shape为(1, )。perchannel量化简称C量化量化对象是右矩阵每个channel分别使用独立的量化参数。假设右矩阵shape为(k, n)k为reduce轴生成量化参数的shape为(n, )。pertoken量化简称K量化量化对象是左矩阵每个token分别使用独立的量化参数。假设左矩阵shape为(m, k)k为reduce轴生成量化参数的shape为(m, )。pergroup量化简称G量化量化对象既可以是左矩阵也可以是右矩阵在reduce轴上对数据分组每组使用独立的量化参数。假设左矩阵shape为(m, k)k为reduce轴在k轴上分组group size为gs生成量化参数的shape为(m, k/gs)。假设右矩阵shape为(k, n)k为reduce轴在k轴上分组group size为gs生成量化参数的shape为(k/gs, n)。perblock量化简称B量化量化对象既可以是左矩阵也可以是右矩阵在所有轴上对数据分块每块使用独立的量化参数。假设左矩阵shape为(m, k)k为reduce轴在m、k轴上分别按(bs, bs)块对数据分组bs为block size生成量化参数的shape为(m/bs, k/bs)。假设右矩阵shape为(k, n)k为reduce轴在k、n轴上分别按(bs, bs)块对数据分组bs为block size生成量化参数的shape为(k/bs, n/bs)。常见组合量化全量化一般是指对左、右矩阵均进行量化的模式包括pertensor-perchannel量化模式简称T-C量化模式pertoken-perchannel量化模式简称K-C量化模式pergroup-perblock量化模式简称G-B量化模式pertensor-perchannel-pergroup量化模式简称T-CG量化模式perblock-perblock量化模式简称B-B量化模式伪量化一般是指对权重矩阵weight进行量化的模式包括perchannel量化模式简称C量化模式。mx量化本质是Microscaling量化通过动态调整缩放因子在极低比特下如1bit保持模型精度。这里指pergroup-pergroup量化模式简称G-G量化模式是对于量化参数类型为FLOAT8_E8M0且group size为32的特例。【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

Tool Calling、Agent、MCP全解析：AI工程三层结构，小白也能看懂大模型如何“干活”并收藏！

本文深入浅出地解析了AI工程中的三层结构：Tool Calling、MCP和Agent。Tool Calling使AI能调用外部工具，MCP作为统一协议层解决了工具接入的标准化问题，而Agent则通过自主思考、规划与多轮执行，让AI从被动响应转变为主动解决问题的…

2026/7/5 3:59:02 阅读更多

SkyfireAI获1100万美元融资，推动无人机自主协同作战

一家致力于改变高风险场景下无人机操作方式的初创公司刚刚完成了新一轮融资，瞄准的正是行业内最棘手的难题之一：如何在不增加飞手数量的前提下，实现无人机规模化运营。SkyfireAI是一家专注于AI驱动无人机自主技术的美国公司，近日完…

2026/7/1 10:36:45 阅读更多

如何快速掌握Video DownloadHelper CoApp：新手入门完整指南

如何快速掌握Video DownloadHelper CoApp：新手入门完整指南【免费下载链接】vdhcoapp Companion application for Video DownloadHelper browser add-on 项目地址: https://gitcode.com/gh_mirrors/vd/vdhcoapp Video DownloadHelper CoApp是一款功能强大的…

2026/7/1 17:48:48 阅读更多

Microsoft NLayerApp案例理论与实践 - 基础结构层（数据访问部分）

Unit Of Work（PoEAA） Unit Of Work（UoW）模式在企业应用架构中被广泛使用，它能够将Domain Model中对象状态的变化收集起来，并在适当的时候在同一数据库连接和事务处理上下文中一次性将对象的变更提交到数据…

2026/7/5 3:58:29 阅读更多

物理AI在工业中的典型应用与优势——基于EdgePLC工业AI边缘控制器

一、什么是物理AI？物理AI（Physical AI） 是指将人工智能模型部署于工业现场的边缘设备上，使机器不仅具备数据分析和决策能力，更能自主感知物理环境、理解复杂工况并做出实时物理调整的新一代智能技术范式。与传统AI运行…

2026/7/5 3:58:29 阅读更多

看懂SqlServer查询计划

对于SQL Server的优化来说，优化查询可能是很常见的事情。由于数据库的优化，本身也是一个涉及面比较的广的话题， 因此本文只谈优化查询时如何看懂SQL Server查询计划。毕竟我对SQL Server的认识有限，如有错误，也恳请您在…

2026/7/5 3:58:29 阅读更多

DeepL翻译插件终极指南：3分钟打造你的浏览器专业翻译助手 [特殊字符]

DeepL翻译插件终极指南：3分钟打造你的浏览器专业翻译助手 🚀 【免费下载链接】deepl-chrome-extension A DeepL Translator Chrome extension 项目地址: https://gitcode.com/gh_mirrors/de/deepl-chrome-extension 还在为阅读外文网页而烦恼吗&a…

2026/7/5 3:58:08 阅读更多

Citra模拟器从入门到精通：5步告别黑屏闪退，畅玩3DS游戏

Citra模拟器从入门到精通：5步告别黑屏闪退，畅玩3DS游戏【免费下载链接】citra A Nintendo 3DS Emulator 项目地址: https://gitcode.com/GitHub_Trending/ci/citra 还在为Citra模拟器的黑屏闪退问题头疼吗？别担心，咱们一起…

2026/7/5 3:58:08 阅读更多

[CherryStudio 接入保姆级教程] | api接入与知识库搭建的一站式教程

本文是一份 CherryStudio 桌面 AI 客户端的完整使用指南。文章从 CherryStudio 的核心定位与亮点讲起，详细介绍了其下载安装、如何通过星途AI平台低成本接入海内外大模型 API、配置联网搜索（Tavily）、构建私有知识库（RAG&#xf…

2026/7/5 3:57:48 阅读更多

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 你是否曾为Windows右键菜单中那些…

2026/7/5 0:00:07 阅读更多

从GitHub安全案例解析常见漏洞与防护实践

1. 项目概述：从GitHub Trending看安全实战最近在GitHub Trending上看到一个项目，叫 skills4/skills ，它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景：一个旨在展示或教授某种技能的仓库，本身却成了安…

2026/7/5 0:01:07 阅读更多

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

# MLT 2026启示：因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战：从“黑箱预测”到“可信推理”2026年6月，第7届机器学习与趋势国际会议（MLT 2026）将在悉尼召开。会议议程中，“因果与可解释机器学习…

2026/7/5 0:01:08 阅读更多

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

2026/7/5 0:00:07 阅读更多

从GitHub安全案例解析常见漏洞与防护实践

2026/7/5 0:01:07 阅读更多

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

2026/7/5 0:01:08 阅读更多

FAE放射组学分析工具：医学影像特征探索的完整解决方案

FAE放射组学分析工具：医学影像特征探索的完整解决方案【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE 你是否曾经面对海量医学影像数据感到无从下手？想要从CT、MRI等影像中提取有价值的定量特征&#…

2026/7/5 0:18:44 阅读更多

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南【免费下载链接】happy-llm 📚 从零开始构建大模型项目地址: https://gitcode.com/GitHub_Trending/ha/happy-llm 还在为大型多模态模型动辄数十亿参数、显存占用高而烦恼&…

2026/7/5 0:22:11 阅读更多

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址…

2026/7/5 0:22:19 阅读更多

相关文章

Tool Calling、Agent、MCP全解析：AI工程三层结构，小白也能看懂大模型如何“干活”并收藏！

SkyfireAI获1100万美元融资，推动无人机自主协同作战

如何快速掌握Video DownloadHelper CoApp：新手入门完整指南

Microsoft NLayerApp案例理论与实践 - 基础结构层（数据访问部分）

物理AI在工业中的典型应用与优势——基于EdgePLC工业AI边缘控制器

看懂SqlServer查询计划

DeepL翻译插件终极指南：3分钟打造你的浏览器专业翻译助手 [特殊字符]

Citra模拟器从入门到精通：5步告别黑屏闪退，畅玩3DS游戏

[CherryStudio 接入保姆级教程] | api接入与知识库搭建的一站式教程

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

FAE放射组学分析工具：医学影像特征探索的完整解决方案

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南