深度学习中训练自己的模型的时候该如何设置学习率呢？

发布时间：2024年01月06日

深度学习中训练自己的模型的时候该如何设置学习率呢？

前言
公式讲解

前言

我们在看完论文之后，想要自己动手在自己家的数据集上试一试模型的效果。但是训练中有太多的超参数需要设置，而且我们的算力资源不一定会和论文作者恰好一样，故而可能设置不同的batch_size这写参数。

batch_size还是很好设置的，估计一个算力能承受的极限即可，当然最好要注意是4的倍数。

但是学习率这个参数往往让人犯了难，无从下手。我们可以借助一个公式来计算我们应该设置的学习率

公式讲解

学习率计算的公式如下：

lr[new]=
	lr[default]*(batch_size[new]*gpu_number[new])/
	(batch_size[default]*gpu_number[default])

这里带default的超参数就是论文原作者使用的超参数了。

文章来源:https://blog.csdn.net/qq_52095705/article/details/135424398
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！