深度学习记录--RMSprop均方根

发布时间：2024年01月22日

RMSprop(root mean square prop)

减缓纵轴方向学习速度，加快横轴方向学习速度，从而加速梯度下降

方法：

$S_{dw}=\beta2 S_{dw}+(1-\beta2)(dw)^2$

$S_{db}=\beta2 S_{db}+(1-\beta2)(db)^2$

$w:=w-\alpha \frac{dw}{\sqrt{S_{dw}}+\varepsilon }$

$b:=b-\alpha \frac{db}{\sqrt{S_{db}}+\varepsilon }$

$\varepsilon =10^{-8}$

原理：

不妨以b为纵轴，w为横轴(横纵轴可能会不同，因为是多维量)

为了让w梯度下降更快，则要使S_dw尽量小，即w每次减去一个大数字，所以w梯度下降更快

为了让b梯度下降更慢，则要使S_db尽量大，即b每次减去一个小数字，所以b梯度下降更慢

为了防止分母趋近于0，则加上一个常量 $\varepsilon$ ，一般设置 $\varepsilon =10^{-8}$

文章来源:https://blog.csdn.net/Xudong_12345/article/details/135729968
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！