斯坦福CS231n学习笔记:DL与CV教程 (3) | 正则化与最优化

发布时间:2024年01月15日

在这里插入图片描述

前言

?? 本节重点内容

  1. 正则化Regularization
  2. 最优化Optimization
  3. 梯度下降

1. 正则化(Regularization)

1.1 为什么引入正则化

上节讲到了如何选择最合适的超参数W,那有没有可能会出现多个这样的参数W1、W2…都能似的损失函数最小呢,答案是非常有可能!!!本节引入正则化就是确定怎么选最合适的W。在这里插入图片描述
在这里插入图片描述

1.2 正则化损失(regularization loss)

为什么要正则化?

  • 表达对权重的偏好
  • 使模型简单,以便它适用于测试数据
  • 通过添加曲率来改进优化
    在这里插入图片描述
    在这里插入图片描述

1.3 常见正则化损失

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

二、优化(Optimization)

🔥🔥🔥重要推荐:可视化工具 http://vision.stanford.edu/teaching/cs231n-demos/linear-classify/

2.1 优化策略

2.2 损失函数可视化

三、梯度计算

3.1 数值梯度法

3.2 解析梯度法

四、梯度下降

文章来源:https://blog.csdn.net/Julialove102123/article/details/135567773
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。