onnx 图像分类

发布时间：2023年12月18日

参考文章：

【netron】模型可视化工具netron-CSDN博客

Pytorch图像分类模型部署-ONNX Runtime本地终端推理_哔哩哔哩_bilibili

使用netron可视化模型结构

1）使用在线版

浏览器访问：Netron

点击 “Open Model” 按钮，选择要可视化的模型文件即可

2）下载本地版

终端进行安装：?pip install netron
安装完成后，在脚本中调用包?import netron
运行程序?netron.start("model.onnx")，会自动打开浏览器进行可视化（最后有例子）

我习惯用 pytorch，但是 netron 对 pytorch 的?.pt?和?.pth?文件不是很友好，所以，我都是先转换为 onnx 格式，再进行可视化，下面举例。

简化可视化模型：

ONNX模型转换及使用指南-CSDN博客

onnx的概念?

训练的归训练，部署的归部署。 onnx的存在极大地降低了部署的难度。

安装配置环境：

安装Pytorch

!pip3 install torch torchvision --extra-index-url https://download.pytorch.org/whl/cu113

安装onnx

!pip install onnx -i https://pypi.tuna.tsinghua.edu.cn/simple

安装推理引擎 ONNX Runtime

!pip install onnxruntime -i https://pypi.tuna.tsinghua.edu.cn/simple

安装其他第三方工具包

!pip install numpy pandas matplotlib tqdm opencv-python pillow -i https://pypi.tuna.tsinghua.edu.cn/simple

验证安装配置成功

import torch
print('PyTorch 版本', torch.__version__)

import onnx
print('ONNX 版本', onnx.__version__)

import onnxruntime as ort
print('ONNX Runtime 版本', ort.__version__)

转ONNX模型文件

导入工具包

import torch
from torchvision import models

# 有 GPU 就用 GPU，没有就用 CPU
device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')
print('device', device)

载入ImageNet预训练PyTorch图像分类模型

model = models.resnet18(pretrained=True)
model = model.eval().to(device)

?构造一个输入图像Tensor

x = torch.randn(1, 3, 256, 256).to(device)

?输入Pytorch模型推理预测，获得1000个类别的预测结果

output = model(x)

output.shape

?Pytorch模型转ONNX格式

with torch.no_grad():
    torch.onnx.export(
        model,                       # 要转换的模型
        x,                           # 模型的任意一组输入
        'resnet18_imagenet.onnx',    # 导出的 ONNX 文件名
        opset_version=11,            # ONNX 算子集版本
        input_names=['input'],       # 输入 Tensor 的名称（自己起名字）
        output_names=['output']      # 输出 Tensor 的名称（自己起名字）
    )

我只修改了自己代码的这个地方↓

        # '''pth模型文件转为onnx格式'''
        with torch.no_grad():
            torch.onnx.export(
                model,                       # 要转换的模型
                img,                           # 模型的任意一组输入
                'resnet34_classification.onnx',    # 导出的 ONNX 文件名
                opset_version=11,            # ONNX 算子集版本
                input_names=['input'],       # 输入 Tensor 的名称（自己起名字）
                output_names=['output']      # 输出 Tensor 的名称（自己起名字）
            )

验证onnx模型导出成功

import onnx

# 读取 ONNX 模型
onnx_model = onnx.load('resnet18_imagenet.onnx')

# 检查模型格式是否正确
onnx.checker.check_model(onnx_model)

print('无报错，onnx模型载入成功')

推理引擎ONNX Runtime部署-预测单张图像

导入工具包

import onnxruntime
import numpy as np
import torch
import torch.nn.functional as F

import pandas as pd

载入 onnx 模型，获取 ONNX Runtime 推理器

ort_session = onnxruntime.InferenceSession('resnet18_imagenet.onnx')

构造随机输入，获取输出结果

x = torch.randn(1, 3, 256, 256).numpy()

x.shape # (1, 3, 256, 256)

# onnx runtime 输入
ort_inputs = {'input': x}

# onnx runtime 输出
ort_output = ort_session.run(['output'], ort_inputs)[0]

注意，输入输出张量的名称需要和 torch.onnx.export 中设置的输入输出名对应

ort_output.shape # (1, 1000)

载入一张真正的测试图像

img_path = 'banana1.jpg'

# 用 pillow 载入
from PIL import Image
img_pil = Image.open(img_path)

预处理函数

from torchvision import transforms

# 测试集图像预处理-RCTN：缩放裁剪、转 Tensor、归一化
test_transform = transforms.Compose([transforms.Resize(256),
                                     transforms.CenterCrop(256),
                                     transforms.ToTensor(),
                                     transforms.Normalize(
                                         mean=[0.485, 0.456, 0.406], 
                                         std=[0.229, 0.224, 0.225])
                                    ])

运行预处理

input_img = test_transform(img_pil)

input_img.shape # torch.Size([3, 256, 256])

input_tensor = input_img.unsqueeze(0).numpy()

input_tensor.shape # (1, 3, 256, 256)

推理预测

# ONNX Runtime 输入
ort_inputs = {'input': input_tensor}

# ONNX Runtime 输出
pred_logits = ort_session.run(['output'], ort_inputs)[0]
pred_logits = torch.tensor(pred_logits)

pred_logits.shape # torch.Size([1, 1000]) 因为ImageNet有1000类

# 对 logit 分数做 softmax 运算，得到置信度概率
pred_softmax = F.softmax(pred_logits, dim=1)

pred_softmax.shape # torch.Size([1, 1000])

解析预测结果

# 取置信度最高的前 n 个结果
n = 3

top_n = torch.topk(pred_softmax, n)

top_n
'''torch.return_types.topk(
values=tensor([[9.9669e-01, 2.6005e-03, 3.0254e-04]]),
indices=tensor([[954, 939, 941]]))'''

# 预测类别
pred_ids = top_n.indices.numpy()[0]

pred_ids
'''array([954, 939, 941])'''

用自己转换好的ONNX模型文件类型预测

        # 加载ONNX模型
        onnx_model_path = 'resnet34_classification.onnx'
        onnx_model = onnx.load(onnx_model_path)

        # 创建ONNX Runtime会话
        ort_session = onnxruntime.InferenceSession(onnx_model_path)

        # 将PyTorch Tensor转换为NumPy数组
        input_data = img.numpy()

        # 运行预测
        ort_inputs = {ort_session.get_inputs()[0].name: input_data}
        ort_outputs = ort_session.run(['output'], ort_inputs)

        # 获取预测结果
        output = ort_outputs[0]
        predict = torch.from_numpy(output)
        predict_cla = torch.argmax(predict).item()

        grading_result = int(class_indict[str(predict_cla)])
        end_time = time.time()
        # 打印预测时间
        prediction_time = end_time - start_time
        print("模型预测时间：{:.4f}秒".format(prediction_time))

        return grading_result

注意：相比于直接用pt文件预测图片，输入的图像转成numpy的数据格式

       # 将PyTorch Tensor转换为NumPy数组
        input_data = img.numpy()

文章来源:https://blog.csdn.net/llf000000/article/details/135057942
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！