ONNXOpen Neural Network Exchange开放神经网络交换是一套用于表示机器学习模型的开放标准格式由 Linux 基金会 AI Data 旗下的 ONNX 联盟ONNX Alliance维护其核心目标是消除深度学习框架壁垒实现模型在不同框架、工具、硬件间的自由迁移与部署ONNX 联盟ONNX AllianceONNX 最初由 FacebookMeta与微软于 2017 年联合发起后纳入Linux 基金会 AILFAI治理成为中立的开源社区项目核心成员Meta、微软、亚马逊、英特尔、英伟达、AMD、ARM、华为、百度、腾讯等治理模式开放社区治理通过SIG特别兴趣小组和WG工作组协作透明决策核心使命为机器学习模型定义通用中间表示IR让 AI 模型成为可跨平台复用的 “通用资产”ONNX 格式核心技术规范ONNX 模型本质是基于Google ProtobufProtocol Buffers序列化的二进制文件后缀.onnx。其规范ONNX IR由三部分构成ONNX核心文件结构Protobuf 定义ONNX 模型是一个分层的ModelProto对象ModelProto顶层容器元数据IR 版本、算子集版本Opset、生产者如 PyTorch、文档、许可证GraphProto核心计算图GraphProto计算图有向无环图DAG包含输入 / 输出ValueInfoProto张量名、数据类型、形状支持动态维度。节点NodeProto算子Op如Conv、ReLU、MatMul初始器Initializer/TensorProto存储权重、偏置等常量参数![[GraphProto计算图.jpeg]]标准算子集Operator Sets核心域ai.onnx定义数百种标准化算子覆盖 CV、NLP、传统 ML 等版本化Opset Version算子按版本迭代如 Opset 24确保向后兼容ONNX扩展域支持自定义域如ai.onnx.contrib、com.huawei用于新增算子ONNX数据类型系统基础类型float32、float16、bfloat16、int8/16/32/64、uint8、bool、string。高级支持FLOAT8FP8 E4M3、E5M2、量化类型、稀疏张量、序列 / 映射等。核心优势跨框架互操作性支持PyTorch、TensorFlow、Keras、MXNet、PaddlePaddle、scikit-learn、XGBoost 等。工作流训练A 框架→ 导出 ONNX → 推理B 框架 / 引擎全平台硬件支持云端CPU、GPUNVIDIA/AMD、TPU、NPU端侧Android、iOS、WebAssembly、嵌入式、IoT引擎ONNX Runtime、TensorRT、OpenVINO、TNN、MNN![[全平台硬件支持.jpeg]]高性能与优化原生支持图优化常量折叠、算子融合、量化INT8/FP16、剪枝ONNX RuntimeORT跨平台高性能推理引擎硬件厂商深度优化可扩展与兼容动态形状、控制流If/Loop、自定义算子、模型版本转换工具典型工作流导出PyTorch/TensorFlow →torch.onnx.export()/tf2onnx→.onnx文件校验onnx.checker.check_model(model)验证合法性ONNX优化onnxsim简化、ORT 优化器、量化工具可视化Netron 工具查看计算图推理ONNX Runtime / TensorRT / OpenVINO 加载运行生态与现状ONNX Model Zoo官方预训练模型库ResNet、BERT、YOLO 等工具链转换器、优化器、可视化、校验工具地位AI 模型部署的事实标准广泛用于云、边、端全场景总结ONNX 是 AI 工业化的关键基础设施通过统一模型表示解决了框架碎片化、部署成本高、硬件绑定等痛点。它让开发者专注建模而非适配加速模型从研发到落地的全流程
1.2.1 AI->ONNX模型格式标准(ONNX Alliance):ONNX(Open Neural Network Exchange)
发布时间:2026/6/4 3:40:47
ONNXOpen Neural Network Exchange开放神经网络交换是一套用于表示机器学习模型的开放标准格式由 Linux 基金会 AI Data 旗下的 ONNX 联盟ONNX Alliance维护其核心目标是消除深度学习框架壁垒实现模型在不同框架、工具、硬件间的自由迁移与部署ONNX 联盟ONNX AllianceONNX 最初由 FacebookMeta与微软于 2017 年联合发起后纳入Linux 基金会 AILFAI治理成为中立的开源社区项目核心成员Meta、微软、亚马逊、英特尔、英伟达、AMD、ARM、华为、百度、腾讯等治理模式开放社区治理通过SIG特别兴趣小组和WG工作组协作透明决策核心使命为机器学习模型定义通用中间表示IR让 AI 模型成为可跨平台复用的 “通用资产”ONNX 格式核心技术规范ONNX 模型本质是基于Google ProtobufProtocol Buffers序列化的二进制文件后缀.onnx。其规范ONNX IR由三部分构成ONNX核心文件结构Protobuf 定义ONNX 模型是一个分层的ModelProto对象ModelProto顶层容器元数据IR 版本、算子集版本Opset、生产者如 PyTorch、文档、许可证GraphProto核心计算图GraphProto计算图有向无环图DAG包含输入 / 输出ValueInfoProto张量名、数据类型、形状支持动态维度。节点NodeProto算子Op如Conv、ReLU、MatMul初始器Initializer/TensorProto存储权重、偏置等常量参数![[GraphProto计算图.jpeg]]标准算子集Operator Sets核心域ai.onnx定义数百种标准化算子覆盖 CV、NLP、传统 ML 等版本化Opset Version算子按版本迭代如 Opset 24确保向后兼容ONNX扩展域支持自定义域如ai.onnx.contrib、com.huawei用于新增算子ONNX数据类型系统基础类型float32、float16、bfloat16、int8/16/32/64、uint8、bool、string。高级支持FLOAT8FP8 E4M3、E5M2、量化类型、稀疏张量、序列 / 映射等。核心优势跨框架互操作性支持PyTorch、TensorFlow、Keras、MXNet、PaddlePaddle、scikit-learn、XGBoost 等。工作流训练A 框架→ 导出 ONNX → 推理B 框架 / 引擎全平台硬件支持云端CPU、GPUNVIDIA/AMD、TPU、NPU端侧Android、iOS、WebAssembly、嵌入式、IoT引擎ONNX Runtime、TensorRT、OpenVINO、TNN、MNN![[全平台硬件支持.jpeg]]高性能与优化原生支持图优化常量折叠、算子融合、量化INT8/FP16、剪枝ONNX RuntimeORT跨平台高性能推理引擎硬件厂商深度优化可扩展与兼容动态形状、控制流If/Loop、自定义算子、模型版本转换工具典型工作流导出PyTorch/TensorFlow →torch.onnx.export()/tf2onnx→.onnx文件校验onnx.checker.check_model(model)验证合法性ONNX优化onnxsim简化、ORT 优化器、量化工具可视化Netron 工具查看计算图推理ONNX Runtime / TensorRT / OpenVINO 加载运行生态与现状ONNX Model Zoo官方预训练模型库ResNet、BERT、YOLO 等工具链转换器、优化器、可视化、校验工具地位AI 模型部署的事实标准广泛用于云、边、端全场景总结ONNX 是 AI 工业化的关键基础设施通过统一模型表示解决了框架碎片化、部署成本高、硬件绑定等痛点。它让开发者专注建模而非适配加速模型从研发到落地的全流程