CANN/cann-bench NMS算子API描述

发布时间：2026/5/20 19:14:05

NMS 算子 API 描述【免费下载链接】cann-bench评测AI在处理CANN领域代码任务的能力涵盖算子生成、算子优化等领域支撑模型选型、训练效果评估统一量化评估标准识别Agent能力短板构建CANN领域评测平台推动AI能力在CANN领域的持续演进。项目地址: https://gitcode.com/cann/cann-bench1. 算子简介对候选框执行非极大值抑制 (Non-Maximum Suppression)根据置信度分数和 IoU 阈值过滤重叠的候选框。主要应用场景目标检测模型如 YOLO、Faster R-CNN的后处理去重实例分割中候选区域的筛选人脸检测等需要消除重叠检测框的场景算子特征难度等级L3SortSelect双输入单输出根据置信度排序并基于 IoU 阈值迭代过滤重叠框输出保留框的索引2. 算子定义数学公式$$ \text{keep_indices} \text{NMS}(\text{boxes}, \text{scores}, \text{iou_threshold}) $$处理流程按 scores 从高到低对候选框排序选取得分最高的框加入保留列表计算该框与剩余所有框的 IoU交并比移除 IoU 大于iou_threshold的重叠框重复步骤 2-4直至所有框被处理其中 IoU 定义为$$ \text{IoU}(A, B) \frac{|A \cap B|}{|A \cup B|} $$3. 接口规范算子原型cann_bench.nms(Tensor boxes, Tensor scores, float iou_threshold) - Tensor keep_indices输入参数说明参数类型默认值描述boxesTensor必选输入候选框格式为 [x1, y1, x2, y2]shape 为 [N, 4]scoresTensor必选每个候选框的置信度分数shape 为 [N]iou_thresholdfloat必选IoU 阈值用于过滤重叠框输出参数Shapedtype描述keep_indices[M]int64NMS 后保留的框索引M N数据类型输入 (boxes) dtype输入 (scores) dtype输出 dtypefloat32float32int64规则与约束boxes的形状必须为 [N, 4]每行为 [x1, y1, x2, y2] 格式scores的形状必须为 [N]且 N 与 boxes 的第一维一致iou_threshold取值范围为 (0, 1)值越小过滤越严格输出keep_indices为 1D int64 张量长度 M 取决于过滤后保留的框数输出索引按置信度从高到低排序支持范围输入 tensor 各维度与参数的支持范围维度 / 参数范围备注boxesshape[N, 4]N ∈ [1, 8192]cases.csv 实测 N ∈ [511, 4096]包含对齐 (1024/4096) 与质数非对齐 (1009/3001/4001)scoresshape[N]与 boxes 第一维一致cases.csv 实测 N ∈ [511, 4096]boxesdtypefloat32cases.csv 实测仅 float32scoresdtypefloat32cases.csv 实测仅 float32boxesvaluefloat32 有限值范围cases.csv 实测 [-65504, 65504]含 float16 边界 / ±inf / nan / 全零等特殊值scoresvalue[0, 1]cases.csv 实测均为 [0, 1]置信度语义iou_threshold(0, 1)cases.csv 实测 0.05 ~ 0.9覆盖严格 / 宽松阈值输出keep_indices[M]M ≤ Nint64长度由过滤结果决定按 scores 从高到低排序约束scores.shape[0]必须等于boxes.shape[0]iou_threshold须严格落在开区间 (0, 1) 内。4. 精度要求采用生态算子精度标准进行验证。误差指标平均相对误差MERE采样点中相对误差平均值$$ \text{MERE} \text{avg}(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)\text{1e-7}}) $$最大相对误差MARE采样点中相对误差最大值$$ \text{MARE} \max(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)\text{1e-7}}) $$通过标准数据类型FLOAT16BFLOAT16FLOAT32HiFLOAT32FLOAT8 E4M3FLOAT8 E5M2通过阈值(Threshold)2^-102^-72^-132^-112^-32^-2当平均相对误差 MERE Threshold最大相对误差 MARE 10 * Threshold 时判定为通过。5. 标准 Golden 代码import torch NMS 算子 Torch Golden 参考实现对候选框执行非极大值抑制 (Non-Maximum Suppression) 公式keep_indices nms(boxes, scores, iou_threshold) def nms( boxes: torch.Tensor, scores: torch.Tensor, iou_threshold: float ) - torch.Tensor: 对候选框执行非极大值抑制公式keep_indices nms(boxes, scores, iou_threshold) Args: boxes: 输入候选框格式为 [x1, y1, x2, y2]shape 为 [N, 4] scores: 每个候选框的置信度分数shape 为 [N] iou_threshold: IoU 阈值用于过滤重叠框 Returns: keep_indices: NMS 后保留的框索引shape 为 [M] # 确保输入格式正确 assert boxes.dim() 2 and boxes.shape[1] 4, boxes shape must be [N, 4] assert scores.dim() 1 and scores.shape[0] boxes.shape[0], scores shape must be [N] # 纯 PyTorch 实现 NMS避免 torchvision ABI 兼容问题 areas (boxes[:, 2] - boxes[:, 0]) * (boxes[:, 3] - boxes[:, 1]) _, order scores.sort(descendingTrue) keep [] while order.numel() 0: if order.numel() 0: break i order[0].item() keep.append(i) if order.numel() 1: order order.new_empty(0) break xx1 boxes[order[1:], 0].clamp(minboxes[i, 0]) yy1 boxes[order[1:], 1].clamp(minboxes[i, 1]) xx2 boxes[order[1:], 2].clamp(maxboxes[i, 2]) yy2 boxes[order[1:], 3].clamp(maxboxes[i, 3]) w (xx2 - xx1).clamp(min0) h (yy2 - yy1).clamp(min0) inter w * h iou inter / (areas[i] areas[order[1:]] - inter 1e-6) inds (iou iou_threshold).nonzero(as_tupleFalse).squeeze(1) order order[inds 1] return torch.tensor(keep, dtypetorch.long, deviceboxes.device)6. 额外信息算子调用示例import torch import cann_bench boxes torch.rand(1000, 4, dtypetorch.float32, devicenpu) * 100 scores torch.rand(1000, dtypetorch.float32, devicenpu) keep cann_bench.nms(boxes, scores, iou_threshold0.5) # 低 IoU 阈值更严格的过滤 keep cann_bench.nms(boxes, scores, iou_threshold0.3)【免费下载链接】cann-bench评测AI在处理CANN领域代码任务的能力涵盖算子生成、算子优化等领域支撑模型选型、训练效果评估统一量化评估标准识别Agent能力短板构建CANN领域评测平台推动AI能力在CANN领域的持续演进。项目地址: https://gitcode.com/cann/cann-bench创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

海淀区浇筑阁楼测评：北京天顺诚达亮点与短板曝光，适合哪类人

本次测评聚焦海淀区浇筑阁楼服务，旨在为对海淀区浇筑阁楼感兴趣的人群提供客观、真实的测评数据，帮助大家更好地了解相关服务情况。参与本次测评的产品为北京天顺诚达建筑工程有限公司。本次测评主要从以下几个核心维度进行评估：1. 施工质量&…

2026/5/20 19:14:05 阅读更多

Verilog运算位宽设计：从补码原理到工程实践

1. 项目概述：为什么Verilog里的位宽不是小事在FPGA或者ASIC设计里写Verilog，尤其是涉及到数据处理模块时，最常被新手甚至一些有经验的工程师忽略的，就是运算结果的位宽。很多人觉得，不就是加、减、乘、除嘛&#xff0c…

2026/5/20 19:12:22 阅读更多

Perplexity谣言传播链追踪：从用户提问→模型幻觉→网页抓取→引用污染的完整闭环分析（含2024最新漏洞CVE编号）

更多请点击： https://codechina.net 第一章：Perplexity谣言辟谣查询 Perplexity 是一款基于大语言模型的实时问答搜索引擎，常被误传为“具备自主意识”“可绕过所有内容安全策略”或“默认返回未经验证的原始网页快照”。这些说法均属不实。…

2026/5/20 19:12:22 阅读更多

大模型推理为什么一上稀疏注意力就开始长程信息丢失：从 Sparse Pattern 到 Full-Dense Fallback 的工程实战

一、长上下文推理的显存困境与稀疏注意力的诱惑 🔥 上下文从 4K 扩展到 128K 后，自注意力显存开销呈平方级增长。7B 模型单条 64K 序列的 KV Cache 即可占满 A100 的 80GB 显存。为支撑长文档推理，滑动窗口、空洞与块稀疏注意力等方案进入工程…

2026/5/20 20:15:08 阅读更多

【RT-DETR实战】054、局部敏感哈希（LSH）注意力简化：当Transformer遇上内存墙

从一次OOM崩溃说起上周在部署RT-DETR到边缘设备时，遇到了一个经典问题：输入分辨率提到640x640，batch size刚调到4，训练就崩了。 nvidia-smi显示显存占用瞬间冲顶，熟悉的“CUDA out of memory”再次出现。问题定位到Transformer的自注意力层——当序列长度L达到1600（40…

2026/5/20 20:13:04 阅读更多

在 OpenClaw 项目中配置 Taotoken 作为 OpenAI 兼容提供商的具体步骤

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度在 OpenClaw 项目中配置 Taotoken 作为 OpenAI 兼容提供商的具体步骤 1. 准备工作：获取必要的凭证与信息在开始配置之…

2026/5/20 20:12:24 阅读更多

GPT-4高考实战测评：解析大模型在复杂中文任务中的能力边界

1. 项目缘起与核心目标最近，我手头正好有一个GPT-4的API接口，闲来无事，就想试试这个被传得神乎其神的语言模型，到底有没有真本事。正好，网上能找到一些往年的北京高考真题，一个念头就冒了出来：让…

2026/5/20 20:12:24 阅读更多

AWorks平台NFC开发实战：从驱动调用到智能门锁应用集成

1. 项目概述：从一块NFC核心板到AWorks平台开发实战最近在做一个智能门锁的项目，其中涉及到NFC刷卡开锁的功能。为了快速验证和开发，我选用了周立功的AWorks平台和一块他们家的NFC核心板。说实话，一开始看到“AWorks”这个名字&am…

2026/5/20 20:12:24 阅读更多

ELF 1开发板Qt 5.15.2交叉编译移植实战指南

1. 项目概述与核心价值最近在ELF 1开发板上折腾一个带图形界面的小项目，自然绕不开Qt这个老伙计。对于嵌入式开发来说，在资源受限的目标板上直接编译Qt这种大型框架几乎是不可能的任务，所以“交叉编译”就成了从主机生成目标板可执行程序的必…

2026/5/20 20:12:03 阅读更多

顶伯在线语音工具背后的技术力量：AI语音合成与深度学习解析

顶伯在线语音工具背后的技术力量在人工智能浪潮中，语音交互正成为人机沟通的核心方式。顶伯作为行业领先的在线语音工具，凭借自主研发的深度学习架构，将文字转化为高度自然的语音，广泛应用于有声阅读、智能客服、教育辅助等领域。…

2026/5/20 0:00:25 阅读更多

全志V3s开发板实战：用Buildroot 2020.02.4定制你的第一个最小Linux文件系统

全志V3s开发板实战：用Buildroot 2020.02.4定制最小Linux文件系统在嵌入式开发领域，构建一个精简高效的Linux文件系统往往是项目成功的关键第一步。全志V3s作为一款高性价比的ARM Cortex-A7芯片，搭配Buildroot这一经典构建工具，能…

2026/5/20 0:00:25 阅读更多

百考通：AI赋能期刊论文写作，智能生成优质内容

在学术研究领域，期刊论文的撰写是成果输出的关键环节，却也让众多科研工作者与学生倍感压力：选题迷茫、逻辑梳理困难、格式规范复杂、内容提炼耗时，严重拖慢了学术成果的发表节奏。百考通（https://www.baikaotongai.com…

2026/5/20 0:00:46 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/20 5:14:40 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/20 16:14:50 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/20 2:02:06 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/20 5:46:58 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/20 3:00:53 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/19 22:33:20 阅读更多

相关文章

海淀区浇筑阁楼测评：北京天顺诚达亮点与短板曝光，适合哪类人

Verilog运算位宽设计：从补码原理到工程实践

Perplexity谣言传播链追踪：从用户提问→模型幻觉→网页抓取→引用污染的完整闭环分析（含2024最新漏洞CVE编号）

大模型推理为什么一上稀疏注意力就开始长程信息丢失：从 Sparse Pattern 到 Full-Dense Fallback 的工程实战

【RT-DETR实战】054、局部敏感哈希（LSH）注意力简化：当Transformer遇上内存墙

在 OpenClaw 项目中配置 Taotoken 作为 OpenAI 兼容提供商的具体步骤

GPT-4高考实战测评：解析大模型在复杂中文任务中的能力边界

AWorks平台NFC开发实战：从驱动调用到智能门锁应用集成

ELF 1开发板Qt 5.15.2交叉编译移植实战指南

顶伯在线语音工具背后的技术力量：AI语音合成与深度学习解析

全志V3s开发板实战：用Buildroot 2020.02.4定制你的第一个最小Linux文件系统

百考通：AI赋能期刊论文写作，智能生成优质内容

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

py每日spider案例之某website之xin东方选课搜索接口(难度一般 扣取代码即可)

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)