if params.grad is not None:
? ? ? ? ? ?params.grad.zero_()
我们实际的运算往往会涉及到若干个requires-grad为true的张量进行运算,在这种情况下,Pytorch会计算整个计算图上的损失的导数,并把这些结果累加到grad属性中。多次调用backward()会导致梯度的错误累积。如果要防止这个问题发生,我们需要在每次迭代的时候手动的把梯度置为零。
Demo的例子
import torch
t_c=torch.tensor([0.5,14.0,15.0,28.0,11.0,8.0,3.0,-4.0,6.0,13.0,21.0])
t_u=torch.tensor([35.7,55.9,58.2,81.9,56.3,48.9,33.9,21.8,48.4,60.4,68.4])
t_un=0.1*t_u
#定义模型
def model(t_u,w,b):
? ? return w*t_u+b
#定义损失函数
def loss_fn(t_p,t_c):
? ? squared_diffs=(t_p-t_c)**2
? ? return squared_diffs.mean()
#唯一改变
params=torch.tensor([1.0,0.0])
params.requires_grad=True
print(params)
#反向传播
loss= loss_fn(model(t_u,*params),t_c)
print(loss)
#对loss 进行反向传播
loss.backward()
#输出params的梯度看看
params.grad