PyTorch自动梯度计算（注意点）

发布时间：2023年12月17日

if params.grad is not None:

? ? ? ? ? ?params.grad.zero_()

我们实际的运算往往会涉及到若干个requires-grad为true的张量进行运算，在这种情况下，Pytorch会计算整个计算图上的损失的导数，并把这些结果累加到grad属性中。多次调用backward()会导致梯度的错误累积。如果要防止这个问题发生，我们需要在每次迭代的时候手动的把梯度置为零。

Demo的例子

import torch
t_c=torch.tensor([0.5,14.0,15.0,28.0,11.0,8.0,3.0,-4.0,6.0,13.0,21.0])
t_u=torch.tensor([35.7,55.9,58.2,81.9,56.3,48.9,33.9,21.8,48.4,60.4,68.4])
t_un=0.1*t_u
#定义模型
def model(t_u,w,b):
? ? return w*t_u+b
#定义损失函数
def loss_fn(t_p,t_c):
? ? squared_diffs=(t_p-t_c)**2
? ? return squared_diffs.mean()
#唯一改变
params=torch.tensor([1.0,0.0])
params.requires_grad=True
print(params)
#反向传播
loss= loss_fn(model(t_u,*params),t_c)
print(loss)
#对loss 进行反向传播
loss.backward()
#输出params的梯度看看
params.grad

文章来源:https://blog.csdn.net/weixin_43882788/article/details/135047361
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！