CANN/asc-devkit：float转half函数

发布时间：2026/5/22 4:18:36

asc_float2half【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√功能说明将float类型转化为half类型并支持多种舍入模式。RINT舍入模式四舍六入五成双舍入ROUND舍入模式四舍五入舍入FLOOR舍入模式向负无穷舍入CEIL舍入模式向正无穷舍入TRUNC舍入模式向零舍入ODD舍入模式最近邻奇数舍入根据输入数据的大小分为非饱和模式和饱和模式。非饱和模式输入数据超过输出类型最值时返回输出类型的对应符号inf值。输入数据为/-inf时, 返回/-inf。输入数据为nan时返回nan。饱和模式输入数据超过输出类型最值时返回输出类型的对应最值。输入数据为/-inf时, 返回输出类型的对应最值。输入数据为nan时返回0。由于源操作数与目的操作数类型位宽比为2:1写入数据时需要将一个VL大小的数据分为两部分根据不同接口选取索引0或者索引1。函数原型// RINT舍入模式, 非饱和模式数据写入索引为偶数的位置 __simd_callee__ inline void asc_float2half_rn(vector_half dst, vector_float src, vector_bool mask) // RINT舍入模式, 饱和模式数据写入索引为偶数的位置 __simd_callee__ inline void asc_float2half_rn_sat(vector_half dst, vector_float src, vector_bool mask) // RINT舍入模式, 非饱和模式数据写入索引为奇数的位置 __simd_callee__ inline void asc_float2half_rn_v2(vector_half dst, vector_float src, vector_bool mask) // RINT舍入模式, 饱和模式数据写入索引为奇数的位置 __simd_callee__ inline void asc_float2half_rn_sat_v2(vector_half dst, vector_float src, vector_bool mask) // ROUND舍入模式, 非饱和模式数据写入索引为偶数的位置 __simd_callee__ inline void asc_float2half_rna(vector_half dst, vector_float src, vector_bool mask) // ROUND舍入模式, 饱和模式数据写入索引为偶数的位置 __simd_callee__ inline void asc_float2half_rna_sat(vector_half dst, vector_float src, vector_bool mask) // ROUND舍入模式, 非饱和模式数据写入索引为奇数的位置 __simd_callee__ inline void asc_float2half_rna_v2(vector_half dst, vector_float src, vector_bool mask) // ROUND舍入模式, 饱和模式数据写入索引为奇数的位置 __simd_callee__ inline void asc_float2half_rna_sat_v2(vector_half dst, vector_float src, vector_bool mask) // FLOOR舍入模式, 非饱和模式数据写入索引为偶数的位置 __simd_callee__ inline void asc_float2half_rd(vector_half dst, vector_float src, vector_bool mask) // FLOOR舍入模式, 饱和模式数据写入索引为偶数的位置 __simd_callee__ inline void asc_float2half_rd_sat(vector_half dst, vector_float src, vector_bool mask) // FLOOR舍入模式, 非饱和模式数据写入索引为奇数的位置 __simd_callee__ inline void asc_float2half_rd_v2(vector_half dst, vector_float src, vector_bool mask) // FLOOR舍入模式, 饱和模式数据写入索引为奇数的位置 __simd_callee__ inline void asc_float2half_rd_sat_v2(vector_half dst, vector_float src, vector_bool mask) // CEIL舍入模式, 非饱和模式数据写入索引为偶数的位置 __simd_callee__ inline void asc_float2half_ru(vector_half dst, vector_float src, vector_bool mask) // CEIL舍入模式, 饱和模式数据写入索引为偶数的位置 __simd_callee__ inline void asc_float2half_ru_sat(vector_half dst, vector_float src, vector_bool mask) // CEIL舍入模式, 非饱和模式数据写入索引为奇数的位置 __simd_callee__ inline void asc_float2half_ru_v2(vector_half dst, vector_float src, vector_bool mask) // CEIL舍入模式, 饱和模式数据写入索引为奇数的位置 __simd_callee__ inline void asc_float2half_ru_sat_v2(vector_half dst, vector_float src, vector_bool mask) // TRUNC舍入模式, 非饱和模式数据写入索引为偶数的位置 __simd_callee__ inline void asc_float2half_rz(vector_half dst, vector_float src, vector_bool mask) // TRUNC舍入模式, 饱和模式数据写入索引为偶数的位置 __simd_callee__ inline void asc_float2half_rz_sat(vector_half dst, vector_float src, vector_bool mask) // TRUNC舍入模式, 非饱和模式数据写入索引为奇数的位置 __simd_callee__ inline void asc_float2half_rz_v2(vector_half dst, vector_float src, vector_bool mask) // TRUNC舍入模式, 饱和模式数据写入索引为奇数的位置 __simd_callee__ inline void asc_float2half_rz_sat_v2(vector_half dst, vector_float src, vector_bool mask) // ODD舍入模式, 非饱和模式数据写入索引为偶数的位置 __simd_callee__ inline void asc_float2half_ro(vector_half dst, vector_float src, vector_bool mask) // ODD舍入模式, 饱和模式数据写入索引为偶数的位置 __simd_callee__ inline void asc_float2half_ro_sat(vector_half dst, vector_float src, vector_bool mask) // ODD舍入模式, 非饱和模式数据写入索引为奇数的位置 __simd_callee__ inline void asc_float2half_ro_v2(vector_half dst, vector_float src, vector_bool mask) // ODD舍入模式, 饱和模式数据写入索引为奇数的位置 __simd_callee__ inline void asc_float2half_ro_sat_v2(vector_half dst, vector_float src, vector_bool mask)参数说明参数名输入/输出描述dst输出目的操作数矢量数据寄存器。src输入源操作数矢量数据寄存器。mask输入源操作数掩码掩码寄存器用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算为0时不参与计算。mask未筛选的元素在输出中置零。矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。返回值说明无流水类型PIPE_V约束说明无调用示例vector_float src; vector_half dst; vector_bool mask asc_create_mask_b32(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 asc_float2half_rn(dst, src, mask);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

洞见规范---幕墙性能之十三太保---防火性能

洞见规范---幕墙性能之十三太保---防火性能《建筑幕墙防火性能分级及试验方法》基于《建筑设计防火规范》GB 50016、《玻璃幕墙工程技术规范》JGJ 102及《人造板材幕墙工程技术规范》JGJ 336对建筑幕墙提出的防火性能的要求制定，是我国首次编制适用于建筑幕墙防火性能分级及…

2026/5/22 4:17:16 阅读更多

文字修仙项目市场价值与商业化分析

文字修仙 AI Agent：市场价值与个人开发者商业化实战指南一、文字修仙游戏的市场基本面——小众赛道的大机会 1.1 全球文字/互动叙事游戏市场规模与增长 1.2 中文修仙品类的独特生态：QQ群 → 微信 → 抖音 1.3 用户画像：谁在玩文字修仙&…

2026/5/22 4:16:35 阅读更多

OptScale 安全最佳实践：10个关键步骤保护你的云成本数据和配置

OptScale 安全最佳实践：10个关键步骤保护你的云成本数据和配置【免费下载链接】optscale FinOps and cloud cost optimization tool. Supports AWS, Azure, GCP, Alibaba Cloud and Kubernetes. 项目地址: https://gitcode.com/gh_mirrors/op/optscale OptS…

2026/5/22 4:16:15 阅读更多

Agent Runtime 正在 commoditize：从 session-as-event-log 看 AI 基础设施分层

1. 这不是新赛道，而是 runtime 层的“操作系统时刻”正在重演你打开手机看到新闻标题《Anthropic Just Shipped the Layer That’s Already Going to Zero》，第一反应可能是：又一个大模型公司搞出了什么黑科技？但如果你真花十分钟…

2026/5/22 5:04:07 阅读更多

反激式开关电源电路的测试记录（一）

各种小功率家电器件中使用更多的是反激式开关电源电路，并且随着功率器件的不断发展，开关电源电路相关产品也在更新换代，比如目前比较流行的氮化镓充电器。由于课题组也在做氮化镓HEMT器件（更多的是在芯片设计和工艺部分&#xff0…

2026/5/22 5:03:27 阅读更多

大学生HTML期末大作业——HTML+CSS+JavaScript购物商城（品优购）

HTMLCSSJS【购物商城】网页设计期末课程大作业 web前端开发技术 web课程设计网页规划与设计💥 文章目录一、🏁 网站题目二、🚩 网站描述三、🎌 网站介绍四、🏴 网站效果五、🏳️ 网站代码六、&#x1f3f3…

2026/5/22 5:02:47 阅读更多

从UISegmentedControl迁移到TwicketSegmentedControl：完整迁移指南

从UISegmentedControl迁移到TwicketSegmentedControl：完整迁移指南【免费下载链接】TwicketSegmentedControl Custom UISegmentedControl replacement for iOS, written in Swift 项目地址: https://gitcode.com/gh_mirrors/tw/TwicketSegmentedControl 想要…

2026/5/22 5:02:06 阅读更多

Tensor Comprehensions高级特性：多GPU支持和内核重用策略的终极指南

Tensor Comprehensions高级特性：多GPU支持和内核重用策略的终极指南【免费下载链接】TensorComprehensions A domain specific language to express machine learning workloads. 项目地址: https://gitcode.com/gh_mirrors/te/TensorComprehensions Tensor…

2026/5/22 5:02:06 阅读更多

CANN/asc-devkit Ascend C矢量压缩API

asc_squeeze 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言，原生支持C和C标准规范，主要由类库和语言扩展层构成，提供多层级API，满足多维场景算子开发诉求。项目地址: https://gitcode.co…

2026/5/22 5:02:06 阅读更多

单日大涨4.52%！华泰柏瑞中韩半导体ETF（513310.SH）上演“高热度”行情，溢价率风险引关注

5月21日，华泰柏瑞中韩半导体ETF（513310.SH）延续强势表现，当日收盘价报5.625元，涨幅达4.52%，盘中交投异常活跃，换手率109.80%，量比为1.32，市场资金交易热情高涨。然而&…

2026/5/22 0:00:46 阅读更多

11. 架构：前端工程化与状态管理实战

写在前面：如果说后端 MVT 引擎是 GIS 系统的“心脏”，那么前端就是它的“大脑”和“面孔”。在现代 WebGIS 开发中，如何优雅地管理复杂的图层状态、如何处理海量瓦片的渲染逻辑，是决定项目成败的关键。今天，我们将深入 light-mvt-server 的前端核心，看看如何利用 Vite …

2026/5/22 0:01:27 阅读更多

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟【免费下载链接】taojinbi 淘宝淘金币自动执行脚本，包含蚂蚁森林收取能量，芭芭农场全任务，解放你的双手项目地址: https://gitcode.com/gh_mi…

2026/5/22 0:02:07 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/21 8:30:37 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/21 16:37:36 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/21 2:29:29 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/21 8:30:37 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/21 5:00:59 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/22 3:58:33 阅读更多

相关文章

洞见规范---幕墙性能之十三太保---防火性能

文字修仙项目市场价值与商业化分析

OptScale 安全最佳实践：10个关键步骤保护你的云成本数据和配置

Agent Runtime 正在 commoditize：从 session-as-event-log 看 AI 基础设施分层

反激式开关电源电路的测试记录（一）

大学生HTML期末大作业——HTML+CSS+JavaScript购物商城（品优购）

从UISegmentedControl迁移到TwicketSegmentedControl：完整迁移指南

Tensor Comprehensions高级特性：多GPU支持和内核重用策略的终极指南

CANN/asc-devkit Ascend C矢量压缩API

单日大涨4.52%！华泰柏瑞中韩半导体ETF（513310.SH）上演“高热度”行情，溢价率风险引关注

11. 架构：前端工程化与状态管理实战

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

py每日spider案例之某website之xin东方选课搜索接口(难度一般 扣取代码即可)

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)