54、Softmax 分类器以及它的底层原理

发布时间：2024年01月06日

下面开始介绍最后一个算法softmax。在前面介绍全连接算法或其他文章中，或多或少也提到了softmax。

在分类网络里，softmax的作用主要是将模型的原始输出映射到 0~1之间的概率分布。很多时候对于我们初学者而言，只知道softmax可以做概率映射，但并不了解它内部的原理是如何完成这个概率映射的，本节来详细的来阐述一下这个过程。

在详细说明这个算法的原理之前，先通过一个例子看一下这个算法的使用场景。

1.一个例子

假设我们要使用神经网络做图片分类，现在有 3 个类别分别是猫，狗，人。如果我们使用 Resnet50 这一个神经网络进行分类，那么最后一层全连接会输出三个得分，也就是它输出的shape为[1, 3]。

我们继续假设猫、狗、人这三个分类的得分分别为：

也就是说，猫得了 2 分，狗得了 1 分，人得了 0.1 分，单看这个结果，我们大概知道，因为猫的得分最高，那最终神经网络会认为这张图片是一只猫，这么理解是可以的，但是大概还是有两个地方有些问题。

第一，神经网络最终选择某一分类，依据的不是得分，而是概率。也就是说，最终神经网络会选择一个概率最高的分类作为它识别的结果。

为什么要使用概率该不是得分呢？主要出于以下几点考虑&#x

文章来源:https://blog.csdn.net/dongtuoc/article/details/135419124
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！