ONNX¶

在深度学习算法开发过程中，模型训练与部署是两个环节，pytorch通常只用于训练，获得模型权重文件，而最终部署还有专门的部署平台，例如TensorRT、NCNN、OpenVINO等几十种部署推理平台。如何将pytorch模型文件让几十种部署推理平台能接收与读取是个大问题。即使各推理平台都适配pytorch，那还有其他训练框架也要适配，是非常麻烦的。 onnx就是为了降低深度学习模型从训练到部署的复杂度，由微软和meta在2017年提出的一种开放神经网络交换格式，目的在于方便的将模型从一个框架转移到另一个框架

pytorch模型导出onnx调用torch.onnx.export函数

Text Only
torch.onnx.export(
    model,
    args,
    f,
    export_params=True,
    opset_version=11,
    do_constant_folding=True,
    input_names=None,
    output_names=None,
    dynamic_axes=None,
    verbose=False
)

参数详情

参数名	说明
`model`	要导出的 PyTorch 模型，通常是 `nn.Module`
`args`	一组示例输入（`torch.Tensor` 或元组），用于构建计算图
`f`	导出路径或文件对象，比如 `"model.onnx"`
`export_params`	是否导出模型参数（True 通常不需要改）
`opset_version`	ONNX 的操作集版本（建议 ≥11，默认是 11）
`do_constant_folding`	是否在导出时执行常量折叠优化（提高推理效率）
`input_names`	给输入张量命名，ONNX 支持具名输入
`output_names`	给输出张量命名
`dynamic_axes`	支持动态尺寸输入输出（比如 batch_size 可变）
`verbose`	是否打印详细导出信息

model: 需要被转换的模型，可以有三种类型， torch.nn.Module, torch.jit.ScriptModule or torch.jit.ScriptFunction

args：model输入时所需要的参数，这里要传参时因为构建计算图过程中，需要采用数据对模型进行一遍推理，然后记录推理过程需要的操作，然后生成计算图。args要求是tuple或者是Tensor的形式。一般只有一个输入时，直接传入Tensor，多个输入时要用tuple包起来。

export_params: 是否需要保存参数。默认为True，通常用于模型结构迁移到其它框架时，可以用False。

input_names：输入数据的名字， (list of str, default empty list) ，在使用onnx文件时，数据的传输和使用，都是通过name: value的形式。 output_names：同上。

opset_version：使用的算子集版本。

dynamic_axes：动态维度的指定，例如batchsize在使用时随时会变，则需要把该维度指定为动态的。默认情况下计算图的数据维度是固定的，这有利于效率提升，但缺乏灵活性。用法是，对于动态维度的输入、输出，需要设置它哪个轴是动态的，并且为这个轴设定名称。这里有3个要素，数据名称，轴序号，轴名称。因此是通过dict来设置的。例如dynamic_axes={ "x": {0: "my_custom_axis_name"} }，表示名称为x的数据，第0个轴是动态的，动态轴的名字叫my_custom_axis_name。通常用于batchsize或者是对于h,w是不固定的模型要设置动态轴。

下面以ResNet18进行举例，onnx文件可通过以下代码获得：

Python
import torchvision
import torch

model = torchvision.models.resnet18(pretrained=True)
dummy_data = torch.randn((1, 3, 512, 512))
with torch.no_grad():
    torch.onnx.export(model, (dummy_data), "resnet18.onnx",
                    opset_version=19,
                    input_names=["input0"],
                    output_names=["output0"])

onnxsim-让导出的onnx模型更精简仓库地址： https://github.com/daquexian/onnx-simplifier

本地版: pip install onnxsim 然后，在终端： onnxsim input_onnx_model output_onnx_model